conteudo-de-qualidade

Como o Google reconhece conteúdo de qualidade?

Uma coisa que ouvimos cada vez mais em SEO é que conteúdo é rei e temos que admitir que as últimas versões e atualizações do algoritmo tem focado muito em reconhecer os conteúdos de qualidade.

Neste vídeo vou tratar de uma assunto denso mas muitíssimo interessante. Sabemos que o Google não é um ser humano portanto fica a pergunta: Como o Google reconhece “algoritmicamente” um conteúdo de qualidade? Este vídeo trás uma fração do entendimento complexo de como o Google faz isso.

Este é um vídeo da série que vai tratar sobre fatores de ranqueamento SEO para 2016

Espero que gostem  😉

 

Ferramenta bacana de keyword density que inclusive deixa exportar para excel as palavras: http://tools.seobook.com/general/keyword-density/

Segue aqui o link para a entrevista que dei quando venci o desafio Darkent/Darkentopolis citei esta entrevista no vídeo: https://www.youtube.com/watch?v=lZV1HZNfXgI

Segue abaixo uma transcrição livre do conteúdo do vídeo

Bom pessoal, meu nome é Rafael de Souza, estou aqui gravando mais um vídeo sobre SEO. Pra quem não me conhece eu tenho um trabalho de divulgar um conteúdo sobre SEO que é uma coisa que eu estudo bastante e gosto muito e eu estou desenvolvendo uma serie de vídeos… Uma serie de conteúdos, e esse é mais um conteúdo que eu estou fazendo pra gerar um conhecimento um pouco mais conciso sobre SEO.

O assunto que eu tenho pra tratar hoje é um assunto relacionado a conteúdo. Existe uma grande duvida no mercado, existe um grande ponto de interrogação sobre os avanços que os algoritmos fizeram nos últimos tempos, todo mundo sabe que os algoritmos avançaram muito, o algoritmos do Google teve um avanço grande na questão semântica principalmente. Se você não estudou semântica é uma coisa importante de se estudar. A gente sabe que o Panda e o Hummingbird são os algoritmos do Google que tiveram mais impacto sobre a questão de conteúdo, mas o hummingbird foi um algoritmo que veio pra trazer uma questão semântica pro conteúdo, pra variação do conteúdo, e fez uma diferença muito grande na qualidade das buscas. Então, baseado nisso, um estudo que eu gosto muito, já citei varias vezes, é o estudo da Search Metrics sobre fatores de rankeamento.

Desde o Hummingbird, quando começaram a analisar fatores de rankeamento relacionados a conteúdos de forma mais especifica. Eles colocaram dois fatores de rankeamento que eu gostaria de falar sobre e eles. O conteúdo que eu vou falar agora, bastante técnico… Bastante especifico, mas é bastante interessante também de se entender por que vai ajudar você a descobrir como o Google de forma algorítmica consegue reconhecer se um conteúdo é de qualidade.

Como sabemos o Google não é um ser humano, ele faz esse reconhecimento de forma algorítmica. Então é uma duvida muito recorrente: Como é que ele faz isso? Como ele descobre de forma algorítmica se um conteúdo é de qualidade ou não? Entender isso pode ajudar em muitas coisas, da pra ajudar de muitas formas. Existem vários fatores que o Google utiliza pra analisar de forma semântica, de forma algorítmica, um conteúdo. Vou bater aqui em dois pontos que vai ajudar a clarear muito o entendimento do pessoal sobre isso, que a Search Metrics chamou de Proof Terms e Relevant Terms. Fazendo uma tradução livre e direta seria: termos relevantes e termos de prova. Vou explicar a diferença entre esses dois e vocês vão ver que isso faz bastante sentido. O que acontece: o Google precisa aprender semanticamente qual a intenção que a pessoa tem quando ela faz uma busca, logico que a intenção é trazer o melhor resultado possível para o usuário, então ela precisa entender isso de uma forma muito eficiente, rápida e muito apurada… Precisa trazer um resultado bem bacana e é o que o Google vem fazendo. Como ele faz isso? Vamos lá, vou usar um exemplo, gosto de usar exemplo por que exemplo sempre deixa a coisa mais fácil: Vamos usar um exemplo que a gente esteja falando sobre um conteúdo sobre “como assar um peru”. O Google, baseado em tudo que ele tem em seu banco de dados, ele faz um cruzamento entre as palavras existentes num texto e ele espera encontrar alguma dessas palavras no texto. Vamos dar um exemplo aqui, e vou separar o que são Proof Terms e o que são Relevant Terms: Pro nosso texto de como assar um peru, o que seria um Proof Term? Sao palavras que o Google espera encontrar nesse texto que estão diretamente relacionadas com o assunto do termo, com o assunto da keyword que a gente quer rankear ou com o assunto daquele texto. Então vamos lá, “como assar um peru?”: o Google espera encontrar palavras como forno, assadeira, graus, centígrados, célsius, temperatura, assado, dourar… São palavras que o Google sabe através de todo o conhecimento que ele tem na sua base de dados, são palavras que estão fortemente relacionados à “como assar um peru?”. Elas precisam ser encontradas. Por que? por que tudo que o Google tem no seu banco de dados mostra que sempre que se fala de como assar um peru essas palavras aparecem nos textos. Palavras como forno, graus, temperatura… sempre aparecem em conteúdos relacionados a assar alguma coisa. Então se você cria um conteúdo sobre como assar um peru e não tem a palavra “forno” o Google automaticamente vai avaliar que seu conteúdo não tem tanta relevância assim, por que ele não encontrou esse termo de prova, esse Proof Term, vamos dizer assim. Termos como forno, graus, assadeira, doura, são termos que provam que seu conteúdo tem a ver ou esta relacionado a assar um peru. Não adianta ter um conteúdo, um texto, sobre como assar um peru que não tenha essas palavras, então o Google espera fortemente encontrar essas palavras no seu texto. Por que ele faz isso? Por que ele espera isso? por que essas palavras fazem parte de todo o universo de conteúdo no banco de dado dele, estão sempre relacionadas, semanticamente relacionadas. Essas são Proof Terms, se você olhar uma lista de Proof Terms como essa que falei, vai ter uma ideia de qual é o assunto que esta se tratando. Forno, assadeira, dourar… da pra entender que é sobre assar alguma coisa.

E o que são relevant terms? São termos que se olhar isoladamente eles não tem a ver diretamente com o assunto, mas o Google também espera que apareçam nesse texto. Quais seriam os relevant terms para nosso artigo ou nosso conteúdo de como assar um peru? Termos como timer, Sadia, que é uma marca muito citada, manteiga, que se usa pra passar no peru na hora de assar, ponto, gás, faca, garfo, batata… O termo “garfo” sozinho não esta diretamente relacionado a como assar um peru, mas o Google também espera que, no processo de assar um peru, em todo o conteúdo que ele tem indexado sobre como assar um peru, essas palavras também sejam relevantes pra isso, o Google espera que essas palavras existam no seu conteúdo. Quando o Google faz esse tipo de cruzamento semântico ele começa a entender se seu conteúdo é de qualidade ou não é de qualidade. Da mesma forma ele usa isso de forma invertida, vou dar um exemplo: imagina que num conteúdo sobre como assar um peru ele encontre dez vezes a palavra parachoque. Bom, parachoque não tem nada a ver com “como assar um peru”, então, em todo o conteúdo que o Google tem indexado, pouquíssimas vezes, ou nenhuma vez, ele encontrou a palavra parachoque junto com “como assar um peru” ou em conteúdos que ele julga importante para como assar um peru. Se você tiver uma incidência relativamente grande de palavras que não tem nada a ver ou que normalmente não são encontradas nos mesmos conteúdos de “como assar um peru”, o Google vai olhar para o seu conteúdo e dizer: Olha, esse conteúdo esta confuso, não era pra gente encontrar dez vezes a palavra parachoque num texto de como assar um peru. O Google, analisando esses fatores de forma algorítmica, ele consegue definir se seu conteúdo esta alinhado com a semântica, ou com a qualidade, ou se ele não esta alinhado. Então, novamente, se você tem um conteúdo sobre como assar um peru e você nenhuma vez cita a apalavra garfo, faca ou assadeira o Google vai perceber de forma algorítmica que esta faltando aquela palavra, por que em todo o universo que ele tem indexado essas palavras aparecem, então se você não colocou seu conteúdo não tem tanta qualidade assim. Se você analisar dessa forma, entre relevant terms e proof terms, todos os conteúdos, você vai conseguir perceber varias coisas interessantes. Vou dar um exemplo: quem me conhece ha um pouco mais de tempo sabe que eu participei de um desafio de Black Hat, que foi o desafio Darkentopolis. Pra quem não sabe o que foi o desafio Darkentopolis: foi o Alejandro, do blog Darkent, que é um blog sobre Black Hat. É um assunto que estudo bastante, não utilizo para os meus clientes esse tipo de coisa, mas eu estudo pessoalmente pra poder entender táticas avançadas de SEO. Ele (*) inventou uma palavra, que era “Darkentopolis”, uma palavra que não tinha nenhum resultado no Google, e lançou o desafio num dia especifico quem tivesse em primeiro lugar pra esse termo ganharia o desafio. Na época participei do desafio e ganhei. Eu utilizei uma estratégia, vou colocar um link na descrição do vídeo ou no meu blog, onde estiver vendo isso, de um vídeo da entrevista que dei sobre como ganhei esse desafio, quais foram as táticas que eu utilizei. Vocês vão ver que lá falo muito sobre uma questão semântica do que eu acreditava do por que eu tinha ganhado o desafio. Rapidamente, como isso esta relacionado com o que estou dizendo aqui? o que acontece, o Google não sabia o que era Darkentopolis, não existia nenhum resultado no Google pra Darkentopolis, então o que eu procurei fazer: criei um conteúdo forçando o algoritmo a entender que Darkentopolis era um lugar, trabalhei com conteúdos de baixa qualidade mas com altíssimo teor semântico. Vou explicar o que é isso: Eu ia lá no Google, procurava em russo, um exemplo: “população da África”, dai eu pregava um conteúdo em russo, traduzia para o inglês, no Google tradutor mesmo, depois para o português e eu ia onde estava a palavra “África” trocara por ” Darkentopolis”. Então lá falava: população da África é composta por pessoas da etnia “tal”. Onde tinha África eu trocava, então ficava: População de Darkentopolis é composta […]. Fui fazendo isso com vários assuntos. Folclore: peguei o folclore da indonésia. Pegava esses conteúdos em outras línguas, traduzia para o português e pegava a palavra “indonésia” e trocava por Darkentopolis. Um conteúdo, vamos dizer assim, todo traduzido, spineado. La tinha moeda, clima, folclore, gastronomia…. Fiz vários artigos, todos eles semanticamente ligados, forçando o algoritmo a entender que eu estava falando de um lugar, de uma cidade, pais, estado… Alguma coisa desse gênero. Então, mesmo com esse conteúdo de baixa qualidade, vamos dizer assim, conteúdo copiado de outros lugares, em outras línguas, eu venci o desafio, basicamente, sem backlink e outras coisas, a gente não utilizou. Não fizemos nenhum backlink, praticamente nada com relação a isso, mas conseguimos convencer o algoritmo de que a gente era um lugar e nosso conteúdo semanticamente fazia sentindo, por que o Google encontrava em nossos artigos proof terms e relevant terms relacionados àquele assunto. Então, quando você vai tratar da gastronomia de um lugar, você vai ter a palavra gastronomia, apimentado, peixe… ou coisas do gênero. Essas palavras, apesar de o conteúdo não ser de tanta qualidade, ser copiado e traduzido, ele continha essas palavras relevantes. Então, de forma algorítmica o Google conseguiu entender isso e deu essa vantagem para a gente. Tive outros competidores, que ate cito no vídeo, que não tiveram esse foco. Tinha gente lá: “Darkentopolis, como ganhar dinheiro na internet”. O Google tentando descobrir o que era Darkentopolis e se convencendo de que era um lugar, “ganhar dinheiro na internet” não era um proof term, nao era um relevant term. O Google automaticamente disse: poxa, isso esta confuso, não era pra aparecer “como ganhar dinheiro na internet” num assunto que é relacionado a um lugar.

Por que é bacana a gente entender esse conceito de proof term e relevant term? Por que se você usar a sua cabeça e pensar fora da caixa um pouco, vai perceber que vai poder fazer alguns estudos muito avançados de criação de conteúdo baseado nisso, tanto para White hat como para grey hat ou ate black hat. Vamos falar que de black hat, se você vai fazer um conteúdo spineado, procure incluir no teu conteúdo proof terms e relevant terms que tenha a ver semanticamente com aquilo que quer rankear. Por que o Google não é uma pessoa, é um algoritmo, mesmo se seu conteúdo seja de baixa qualidade, ainda sim o Google vai ver relevância, por que ele vai encontrar essas palavras que ele espera encontrar nesse conteúdo. É logico, tudo isso que estou dizendo aqui é o esmiuçar do algoritmo, se você simplesmente se propor a escrever um conteúdo de qualidade mesmo automaticamente você vai perceber que o seu conteúdo já vai ter proof terms e relevat terms. Se eu pegar agora pra escrever um conteúdo de qualidade sobre um assunto especifico, no final, depois de escrever lá por 1000 e poucas palavras, vou olhar e perceber que eu usei proof terms e relevant terms no meu conteúdo, mas posso ficar atento pra isso pra poder melhorar essa qualidade. Vou dar um exemplo: O que você pode fazer? Se você quer rankear para “como assar um peru” você pode pegar os 10 conteúdos que estão rankeado nos 10 primeiros resultados, jogar em qualquer ferramenta de keyword density, de densidade de palavra chave, e ele vai te mostrar as palavras chave que tem mais densidade em todos esses conteúdos. Se você colocar isso numa planilha, vai perceber que seu conteúdo precisa ter aqueles termos, pelo menos, para que você tenha algum sinal semântico pro Google e que não esqueça uma palavra muito relevante ou uma palavra de prova no seu conteúdo.

Com isso, você pode fazer um avanço na sua criação de conteúdo, entender esses conceitos vão te ajudar tanto se você for fazer um trabalho de White hat ou ate mesmo se você for fazer um conteúdo spineado, um conteúdo só pra” encher uma linguiça” num site de uma tier, ou alguma coisa do gênero.

Era esse conceito que eu queria passar hoje, um conceito bastante denso, mas ele explica pra você como o Google aprende o que é um conteúdo de qualidade. Existem vários fatores semânticos de similaridade, de “sinonimissidade”, se é que existe essa palavra, de palavras que são sinônimas. Como é que o Google descobriu que “odontologia” e “dentista” tem a ver?  Por que em todo o conteúdo que ele tem indexado essas palavras aparecem muitas vezes juntas, então assim ele aprende que essas palavras tem a ver uma com a outra. Ele espera que se você escrever um artigo sobre dentista você vai acabar colocando a palavra “odontologia” e se escrever sobre odontologia vai acabar colocando a palavra “dentista” ou a palavra “dente”, elas estão todas semanticamente relacionadas. É muito importante você entender isso, por que dessa forma que o Google faz o seu trabalho de avaliar um conteúdo de qualidade ou não. Por isso que depois do Hummingbird, alguns especialistas tendem a dizer que se perdeu muito a otimização para palavras chave e começou-se a fazer a otimização para tópicos. Por quê? Por que hoje existe a possibilidade de você rankear em primeiro lugar para uma keyword e você, as vezes, não encontrar essa keyword nenhuma vez nesse texto. Por que? Por que se a gente entender que o Google compreende a semântica entre essas coisas… Vou dar um exemplo: tenho um exemplo de um cliente meu, você vai ver que isso é muito normal em varias coisas, em que ele aluga um certo equipamento. Então, se você colocar “aluguel do equipamento x”, ele aparece em primeiro lugar, mas na verdade ele não tem a palavra aluguel nenhuma vez, a gente só usa no site dele “locação”. Por que a gente aparece quando se procura “aluguel do equipamento x” sendo que a gente não tem nenhuma vez a palavra aluguel, só locação? Por que o Google já sabe que aluguel e locação são sinônimos, ele já aprendeu isso, e todos os outros fatores de rankeamento fizeram com que a gente rankeasse em primeiro a despeito da gente não ter aquela keyword exata “aluguel”. É bacana entender isso e é importante fazer essa correlação e estudar um pouco mais sobre isso que vai ajudar bastante nas suas estratégias. Ta certo? Então esse é o vídeo que eu queria deixar hoje, se inscrevam no canal que eu vou lançar mais vídeos, coloque seu nome e e-mail que eu vou mandando mais conteúdo de qualidade pra vocês, ta bom? Comentem o que acharam do vídeo. Valeu. Até mais.

Como o Google reconhece conteúdo de qualidade? 4.97/5 (99.47%) 75 votes

Receba as novidades

Pode colocar seu email ai tranquilo, não é formula do lançamento.

Esta é uma forma automatizada de enviar emails com os novos posts e vídeos para você.

25 thoughts on “Como o Google reconhece conteúdo de qualidade?

  1. Show de bola Rafael!

    Então mesmo na hora de montar um site de PBN parece ser importante cuidar bastante do texto que apontamos diretamente para o nosso Money Site!

    Você acha que essa regra vale também para o site por inteiro? Por exemplo, no mesmo site falamos sobre “assar o peru” e sobre “para-choque”.

    Parabéns, os conteúdos compartilhados estão com altíssima qualidade!

    Um abraço!

    1. Denilson acho que a regra vale sim, como no seu exemplo, um conteúdo sobre parachoques num blog ou site de culinária teria sim mais dificuldade de rankear do que num site do mundo automotivo, não estou dizendo que não rankearia, mas seria bem mais difícil, sabemos bem que o Google gosta mais de especialidades do que generalidades.

  2. Conteúdo de primeira … aprendizado do início ao fim do vídeo.

    Vou me atentar a essa questão da semântica … acho q isso aí serve até pra ficar de olho também nos artigos dos concorrentes e inspirar nos relevant terms e proof terms das páginas mais bem posicionadas.

    valeuu

  3. Não comento muito em blogs, mas, esse faço questão, de tirar o chapéu literalmente. Rafael pense em criar um curso online de White que já tem aluno certo =)

  4. Olá Rafael, muito boa as dicas. Eu uso na prática mais não sabia esses termos técnicos…

    Me diga uma coisa que fiquei curioso, neste desafio do darktopolis (não sei se é assim que escreve rs), quanto tempo você levou para posicionar com estas técnicas?

    Até logo…

  5. Olá Rafael, excelente artigo, trazendo informação muito relevante. É como você disse, temos que começar a colocar a cabeça pra funcionar e pensar fora da caixa. Eu nunca havia imaginado esse contexto que você mencionou sobre semântica. Andei analisando um site de um concorrente de um cliente meu, e percebi que ele usa como padrão nas páginas dos produtos, a repetição de 20 vezes a mesma palavra-chave e por 5 vezes o nome da empresa. Imagino que isso possa ser stuf e o se Google pegar pode penalizar o site, não? E vejo que os caras vendem isso como uma estratégia de SEO, cobrando caro. O que você acha disso?

  6. Belo artigo Rafael, bem consistente sempre transmitindo conteúdos relevantes.
    Produzi um conteúdo com pouco mais de 300 palavras esta na página 3 do google dentre 318.000 resultados.
    Outro artigo com 1000 palavras está na página 9 dentre 35.000 resultados, sendo que o PA e DA das palavras chaves são equivalentes, não consegui entender direito.

  7. Olá Rafael,
    Uma dúvida para você “instruir” o google do termo Darkentopolis você usou
    web 2.0, domínios próprios? ps: informações muito relevantes, parabéns Rafael
    grato,
    Jose

  8. Olá Eu cheguei até este POST no google do termo Darkentopolis você usou, mas agora mudou o conteudo e aparece outro… gostei de conhecer teu site… informações muito boasparabéns Rafael
    grato,
    Jose

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *