Porque é que o Google pode classificar os conteúdos gerados por IA em detrimento das notícias originais

Um relatório recente do 404media.co alegou que “o Google News está a impulsionar sites que roubam outros meios de comunicação, utilizando a IA para produzir rapidamente conteúdos”.

Embora Danny Sullivan, o SearchLiaison da Google, tenha dado uma resposta oficial à alegação, não oferece uma explicação completa sobre a razão pela qual alguns domínios se destacam mais do que outros nas notícias.

Este artigo explora algumas dessas razões, juntamente com sugestões específicas de SEO para editores, jornalistas e repórteres que pretendam obter uma classificação mais elevada nos resultados de pesquisa.

O Google está a impulsionar os conteúdos gerados por IA?

Não, o Google não está a fazer nada para colocar manualmente determinados conteúdos no topo dos resultados de pesquisa, de acordo com o Google SearchLiaison on X.

Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originaisCaptura de ecrã de X, janeiro de 2024Porque é que o Google pode classificar os conteúdos gerados por IA em detrimento das notícias originais

Em vez disso, o algoritmo do Google utiliza factores de classificação para determinar que conteúdo deve aparecer em primeiro lugar nos resultados da pesquisa.

5 razões pelas quais um artigo de notícias é bem classificado na pesquisa do Google e no Discover

Utilizando alguns exemplos mencionados no 404 Media relatório, eis algumas explicações para o facto de os conteúdos gerados por IA, os conteúdos duplicados, os conteúdos sindicados, os agregadores de conteúdos e os ladrões de conteúdos serem mais importantes do que as fontes de notícias originais.

1. Recência

Uma das primeiras explicações oferecidas pelo Google SearchLiaison para o facto de o conteúdo gerado por IA ser superior ao de outros editores é a atualidade do conteúdo noticioso quando ordenado por data.

Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originaisCaptura de ecrã de X, janeiro de 2024Porque é que o Google pode classificar os conteúdos gerados por IA em detrimento das notícias originais

Aqui estão dois sítios que se classificam como as principais notícias para o ESPN Spectrum.

Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originaisCapturas de ecrã de Watcher.guru & Examiner, janeiro de 2024Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originais

Ambos os sites superam a CNET, Kiplinger e The Verge, provavelmente devido à sua atualidade.

Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originaisCaptura de ecrã do Google, janeiro de 2024Porque é que a Google pode classificar os conteúdos gerados por IA em detrimento das notícias originais

O scanner de conteúdo da Originality.ai estava 100% confiante de que o conteúdo de um sítio era gerado por IA, enquanto estava apenas 52% confiante em relação ao outro. Este último sítio apresentou uma declaração de exoneração de responsabilidade sobre a utilização de IA na criação de conteúdos.

Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originaisCaptura de ecrã de Originality.ai, janeiro de 2024Porque é que o Google pode classificar os conteúdos gerados por IA em detrimento das notícias originais

Como é que os outros motores de busca se comparam? Veja aqui os principais resultados de pesquisa do Bing.

Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originaisPorque é que o Google pode classificar os conteúdos gerados por IA em detrimento das notícias originais

Captura de ecrã do Bing, janeiro de 2024Watcher.guru aparece mais abaixo na página nos resultados de pesquisa do Bing, mas não nas notícias.

Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originaisCaptura de ecrã do ChatGPT, janeiro de 2024Porque é que o Google pode classificar os conteúdos gerados por IA em detrimento das notícias originais

O domínio também aparece como uma das fontes numa resposta do ChatGPT sobre o tema.

Porque é que o Google pode classificar o conteúdo gerado por IA em vez das notícias originaisCaptura de ecrã do ChatGPT, janeiro de 2024Porque é que o Google pode classificar os conteúdos gerados por IA em detrimento das notícias originais

Embora a Originality.ai tivesse apenas 62% de certeza em relação a uma, estava 100% confiante de que as outras três fontes eram geradas por IA.

2. Idade do domínio & Backlinks

Agora, vamos afastar-nos do conteúdo e analisar algumas métricas sobre os domínios no exemplo acima.

Watcher.guru tem maior autoridade e visibilidade na Pesquisa do Google, de acordo com a Semrush. Mas o domínio tem apenas nove anos de idade.

Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originaisCaptura de ecrã da Semrush, janeiro de 2024Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originais

Comparativamente, o Examiner.com tem mais domínios de referência e backlinks, juntamente com 19 anos de história do domínio.

Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originaisCaptura de ecrã da Semrush, janeiro de 2024Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originais

É claro que a força do domínio não ajudou o Examiner.com no tráfego orgânico e nas palavras-chave ao longo dos anos. Só ocasionalmente ajuda o site nos resultados de notícias do Google.

3. Relevância

Quando os resultados da pesquisa não são ordenados por data, a relevância torna-se um fator-chave nos resultados da pesquisa.

Embora não esteja relacionado com o conteúdo gerado por IA, John Mueller, advogado da Pesquisa Google, observou uma vez que o conteúdo sindicado poderia ultrapassar a classificação fontes de notícias originais devido ao conteúdo do sítio Web que o rodeia.

Efetivamente, os sítios Web que republicam os seus artigos de notícias podem ter uma classificação superior à sua porque têm um contexto no cabeçalho, na barra lateral, nos artigos circundantes ou no rodapé que é mais relevante para a consulta de pesquisa do utilizador do que o do seu sítio.

Aqui está outro exemplo. Quando pesquisei por transmissão em direto da NFL, as seguintes notícias apareceram depois do sítio Web oficial da NFL.com e dos vídeos do YouTube relacionados com a consulta.

Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originaisCaptura de ecrã do Google, janeiro de 2024Porque é que o Google pode classificar os conteúdos gerados por IA em detrimento das notícias originais

O artigo do Yahoo Entertainment é da revista Rolling Stone.

Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originaisCaptura de ecrã do Yahoo, janeiro de 2024Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originais

Na mesma página do artigo do Yahoo há um menu de navegação com uma secção de Desporto, um clip de vídeo de reprodução automática de um jogo recente da NFL e mais notícias relacionadas com a NFL a seguir ao artigo.

Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originaisCaptura de ecrã do Yahoo, janeiro de 2024Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originais

Agora, vamos comparar a página do Yahoo com o artigo da Rolling Stone com o artigo real no sítio Web da Rolling Stone.

  • O menu principal não tem uma secção de desporto no seu menu principal.
  • As últimas notícias na barra lateral abrangem política e entretenimento.
  • O artigo é seguido de mais sugestões de notícias sobre moda, música, educação e viagens.
Porque é que o Google pode classificar os conteúdos gerados por IA em detrimento das notícias originaisCaptura de ecrã da Rolling Stone, janeiro de 2024Porque é que o Google pode classificar os conteúdos gerados por IA em detrimento das notícias originais

Isto torna a versão Yahoo do artigo da Rolling Stone mais relevante para os utilizadores que pesquisam palavras-chave com NFL.

Relativamente à idade do domínio, a Rolling Stone (criada a 21 de setembro de 1994) é três meses mais antiga do que o Yahoo.

O que é que o Yahoo tem: 7B backlinks de 2.3M domínios de referência, comparado com a Rolling Stone com 60M backlinks de 352K domínios de referência.

Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originaisCaptura de ecrã da Semrush, janeiro de 2024Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originais

4. Acesso ao rastreador

Porque é que o Google pode classificar os conteúdos gerados por IA em detrimento das notícias originaisCaptura de ecrã de X, janeiro de 2024Porque é que o Google pode classificar os conteúdos gerados por IA em detrimento das notícias originais

Uma forma rápida de verificar se o Google tem acesso ao conteúdo de um domínio específico é a palavra-chave site:domínio.com pesquise.

Porque é que o Google pode classificar os conteúdos gerados por IA em detrimento das notícias originaisCaptura de ecrã do Google, janeiro de 2024Porque é que o Google pode classificar os conteúdos gerados por IA em detrimento das notícias originais

Conseguir que o Google indexe o conteúdo de um sítio Web é apenas metade da batalha.

Porque é que o Google pode classificar o conteúdo gerado por IA em detrimento das notícias originaisCaptura de ecrã do Google, janeiro de 2024Porque é que o Google pode classificar os conteúdos gerados por IA em detrimento das notícias originais

Conseguir que o Google coloque uma página específica do seu sítio Web no topo dos resultados de pesquisa para uma consulta de palavra-chave específica é o verdadeiro desafio.

Porque é que o Google pode classificar o conteúdo gerado por IA em vez das notícias originaisCaptura de ecrã do Google, janeiro de 2024Porque é que a Google pode classificar os conteúdos gerados por IA em detrimento das notícias originais

5. Tópicos API

A API Topics faz parte da iniciativa Privacy Sandbox da Google para melhorar a privacidade dos utilizadores.

“No passado, foram utilizados cookies de terceiros e outros mecanismos para seguir o comportamento de navegação do utilizador em vários Web sites para inferir tópicos de interesse. Estes mecanismos estão a ser gradualmente eliminados.

Com a API de Tópicos, o browser observa e regista tópicos que parecem ser do interesse do utilizador, com base na sua atividade de navegação. Esta informação é registada no dispositivo do utilizador. A API de Tópicos pode então dar aos chamadores da API (tais como plataformas de tecnologia de anúncios) acesso aos tópicos de interesse de um utilizador, mas sem revelar informações adicionais sobre a atividade de navegação do utilizador.”

Embora a Google tenha concebido esta funcionalidade para a segmentação de anúncios após a depreciação dos cookies de terceiros, é de perguntar se a classificação de um sítio Web também afecta a sua colocação com sítios Web semelhantes no Google News.

Segue-se uma comparação entre 404media.co e os sítios classificados no Google News para o tópico em questão.

Porque é que o Google pode classificar o conteúdo gerado por IA em vez das notícias originaisCaptura de ecrã do Google Chrome, janeiro de 2024Porque é que a Google pode classificar os conteúdos gerados por IA em detrimento das notícias originais

Não é um fator de classificação: O autor

Um tema recorrente na pesquisa ao longo do tempo é como o Google trataria o conteúdo gerado por IA.

Em abril de 2022Mueller afirmou que os conteúdos gerados automaticamente – incluindo os conteúdos criados com ferramentas de IA generativas – são contrários às directrizes da Pesquisa Google.

“A minha suspeita é que talvez a qualidade do conteúdo seja um pouco melhor do que a das ferramentas da velha guarda, mas para nós continua a ser conteúdo gerado automaticamente, o que significa que para nós continua a ser contra as Directrizes para Webmasters. Por isso, consideramos que se trata de spam”.

Avance rapidamente para fevereiro de 2023, quando a Google publicou orientações sobre conteúdos gerados por IA. Especificamente, a Google afirmou que iria recompensar conteúdos de elevada qualidade, independentemente da forma como fossem produzidos. As divulgações sobre conteúdos gerados por IA são “úteis” quando “razoavelmente esperadas”.

“As divulgações de IA ou automação são úteis para conteúdos em que alguém possa pensar “Como é que isto foi criado?”. Considere adicioná-las quando for razoavelmente expetável.”

Uma noção semelhante foi partilhada em junho de 2023 sobre a divulgação de conteúdos gerados por IA e E-E-A-T.

“Do ponto de vista da Google, não é necessário rotular explicitamente o conteúdo gerado por IA como conteúdo gerado por IA, uma vez que avaliamos a natureza do conteúdo.”

Para reforçar a ideia, o Google SearchLiason afirmou num post no X que títulos de autor são para os utilizadores e não um fator de classificação para a Pesquisa Google.

Sei que esta será uma “resposta simples, quase pitoresca”, mas esta parte do artigo está errada e não nos cita a dizer isto. O Google não ‘verifica as nossas credenciais’ de alguma forma”.

4 dicas de SEO para superar os concorrentes no Google News

Não importa se o site que está a ultrapassá-lo nos resultados de pesquisa é uma fazenda de conteúdo gerada por IA ou uma agência de notícias estabelecida. Qualquer site que o ultrapasse é seu concorrente na pesquisa.

Não é garantido que estas dicas funcionem, mas podem certamente ajudar.

1. Verifique se existem problemas técnicos que afectam a forma como os motores de busca indexam o seu conteúdo.

O Google oferece-lhe dicas, ferramentase conselhos para ajudar os proprietários de sítios Web a resolverem problemas técnicos de SEO que podem impedir os motores de busca de acederem e indexarem o conteúdo do sítio Web.

2. Crie links para o seu próprio conteúdo nos seus artigos com contexto.

Um dos principais factores de classificação que ajudam o Google a ordenar os resultados na pesquisa são os links.

O Google sugere especificamente que os proprietários de sítios Web façam referências cruzadas do seu próprio conteúdo com ligações internas.

Os links internos devem utilizar texto âncora optimizado para palavras-chave, como o brie mais antigo do mundo para dar aos leitores e aos motores de busca um contexto sobre a ligação.

google search essentials ligações internasCaptura de ecrã do Google, janeiro de 2024links internos essenciais da pesquisa do google

No parágrafo seguinte do relatório do 404 Media, existe uma oportunidade para adicionar uma ligação interna a um dos artigos do 404 Media sobre o CivitAI com a palavra-chave âncora CivitAI.

Porque é que o Google pode classificar os conteúdos gerados por IA em detrimento das notícias originaisCaptura de ecrã de 404media.co, janeiro de 2024Porque é que o Google pode classificar o conteúdo gerado por IA em vez das notícias originais

Em vez disso, existem duas hiperligações de saída – uma para o Google News e outra para um editor que os supera nos resultados de pesquisa.

resultados do google newsCaptura de ecrã do Google News, janeiro de 2024resultados do google news

Isto leva-nos a outra importante dica de SEO sobre ligações.

3. Evite colocar links para concorrentes.

Regra geral, não crie ligações para sítios Web que não queira que tenham uma classificação boa ou melhor do que o seu sítio Web nos resultados de pesquisa.

Tal como os links internos para os seus artigos podem otimizar o seu conteúdo para pesquisa, os links externos para os artigos de um concorrente podem otimizar o conteúdo do concorrente para pesquisa.

Se pensa que um site roubou conteúdo ou não creditou devidamente alguém pelo conteúdo “emprestado”, não o ajude com um link.

Tudo o que faz é enviar os seus visitantes E os rastreadores dos motores de busca para os concorrentes, “aumentando” ainda mais a sua visibilidade e alcance.

No parágrafo seguinte do relatório, existem ligações para artigos originais sobre o Heavy e o Distractify, bem como para um sítio que alegadamente “roubou” conteúdos para obter receitas de publicidade.

Porque é que o Google pode classificar os conteúdos gerados por IA em detrimento das notícias originaisCaptura de ecrã do Google News, janeiro de 2024Porque é que o Google pode classificar os conteúdos gerados por IA em detrimento das notícias originais

Isto dá aos criadores de conteúdos originais e aos seus concorrentes um valioso “sumo de link.”

De seguida, tem de se concentrar em criar links de entrada de outros sites para o seu conteúdo. Como?

4. Contacte qualquer pessoa que utilize a sua investigação original para obter uma ligação.

Se foi realmente a primeira pessoa a descobrir um problema ou a partilhar uma história, merece crédito por isso.

A melhor forma de obter crédito pelo seu trabalho é contactar o autor do conteúdo que utilizou a sua investigação. Informe-o de que gostaria de receber um link para o seu artigo como crédito pela utilização da informação.

Se o autor não responder, pode contactar a equipa editorial do site ou o formulário de contacto geral para pedidos de revisão.

Se estes esforços não resultarem numa resposta, pode dar-lhes um empurrão público no X ou na plataforma social que mais utilizam.

Enquanto alguns sites lhe darão crédito com um link que ofereça o máximo valor SEO possível, outros darão nofollow ao seu link.

Porque é que o Google pode classificar o conteúdo gerado por IA em vez das notícias originaisCaptura de ecrã de Engadget, janeiro de 2024Porque é que o Google pode classificar os conteúdos gerados por IA em detrimento das notícias originais

O nofollow retira efetivamente algum do seu “poder de impulso” para a pesquisa, embora possa ainda levar a um aumento do tráfego de referência, novos subscritores e novos fãs nas redes sociais.

Em situações em que o seu conteúdo tenha sido roubado literalmente e o proprietário do sítio se recuse a dar crédito ou a remover o seu conteúdo, existe a opção de apresentar um DMCA Takedown solicite.

Como já foi referido, a última coisa que quer fazer é criar links para sites que o ultrapassam sem crédito – os seus links apenas ajudam a “impulsionar” as classificações de outros sites mais elevados nos resultados de pesquisa.

As capturas de ecrã são a sua melhor opção para partilhar menções não creditadas do seu trabalho noutros sites.

O mesmo se aplica às redes sociais. Quando partilha o link de outro site ou marca o nome de utilizador de um ladrão de conteúdos, aumenta o tráfego de referência e o envolvimento nessa plataforma social.

O envolvimento – seja positivo ou negativo – irá aumentar a visibilidade desse utilizador. Pense se quer mesmo fazer isto.

Conclusão

À medida que a Google continua a atualizar a sua algoritmo e adicione novos características generativas de IA à pesquisaé importante que os proprietários de sítios Web monitorizem a visibilidade do seu sítio nos resultados de pesquisa e continuem a otimizar o conteúdo do seu sítio Web para pesquisa, redes sociais e fontes de tráfego adicionais.

Imagem em destaque: Funstock/Shutterstock