Terra Brasil
Sistema desenvolvido por professor e aluno do MIT mostrou 95% de precisão e se antecipa em média uma hora e meia à lista de Trend Topics do microblog
Já é possível prever com antecedência quais serão os Assuntos do Momento (Trending Topics) do Twitter. Um professor e um aluno do Massachusetts Institute of Technology (MIT) descobriram um algoritmo que pode apontar, com 95% de precisão, quais temas serão os mais populares no microblog em média uma hora e meia antes de o algoritmo do Twitter colocar o assunto nessa lista. Em alguns casos, o novo algoritmo pode se antecipar ao do microblog em até cinco horas.
A descoberta do professor Devavrat Shah e do estudante Stanislav Nikolov pode ser de relevância para o Twitter, que pode explorar possibilidades comerciais a partir da antecipação de assuntos populares, como a venda de anúncios relacionados a temas que entrarão para a lista dos mais comentados do momento. O algoritmo também representa uma nova abordagem em análises estatística já que, em teoria, pode ser aplicado a qualquer número que varie ao longo do tempo como a duração de uma viagem, a venda de ingressos para o cinema e provavelmente até preços de ações na bolsa.
Como todo algoritmo, o desenvolvido por Shah e Nikolov precisa ser treinado, o que significa especificar determinados padrões a serem considerados. "É um modelo muito simplista", define o professor, explicando que eles buscam treinar o algoritmo com base em dados para identificar um grande "salto", de popularidade no caso dos tweets, e acompanhar como esse grande salto acontece. O problema, segundo Shah, é que "há mil coisas que poderiam acontecer", portanto, ele e o aluno têm deixado que "os dados decidam".
Em seus experimentos, a dupla montou um treinamento do algoritmo definindo 200 assuntos no Twitter que mostravam popularidade e outros 200 que não. Em tempo real, o sistema mostrou 95% de acertos em relação às publicações. Mas Shah diz que a precisão do sistema deve melhorar conforme se aumentem as especificações de treinamento do algoritmo quanto à quantidade de dados a serem considerados, o que significa necessidade de mais recursos de computação.
Sistema desenvolvido por professor e aluno do MIT mostrou 95% de precisão e se antecipa em média uma hora e meia à lista de Trend Topics do microblog
Foto: Reuters
A descoberta do professor Devavrat Shah e do estudante Stanislav Nikolov pode ser de relevância para o Twitter, que pode explorar possibilidades comerciais a partir da antecipação de assuntos populares, como a venda de anúncios relacionados a temas que entrarão para a lista dos mais comentados do momento. O algoritmo também representa uma nova abordagem em análises estatística já que, em teoria, pode ser aplicado a qualquer número que varie ao longo do tempo como a duração de uma viagem, a venda de ingressos para o cinema e provavelmente até preços de ações na bolsa.
Como todo algoritmo, o desenvolvido por Shah e Nikolov precisa ser treinado, o que significa especificar determinados padrões a serem considerados. "É um modelo muito simplista", define o professor, explicando que eles buscam treinar o algoritmo com base em dados para identificar um grande "salto", de popularidade no caso dos tweets, e acompanhar como esse grande salto acontece. O problema, segundo Shah, é que "há mil coisas que poderiam acontecer", portanto, ele e o aluno têm deixado que "os dados decidam".
Em seus experimentos, a dupla montou um treinamento do algoritmo definindo 200 assuntos no Twitter que mostravam popularidade e outros 200 que não. Em tempo real, o sistema mostrou 95% de acertos em relação às publicações. Mas Shah diz que a precisão do sistema deve melhorar conforme se aumentem as especificações de treinamento do algoritmo quanto à quantidade de dados a serem considerados, o que significa necessidade de mais recursos de computação.

Postar um comentário
-Os comentários reproduzidos não refletem necessariamente a linha editorial do blog
-São impublicáveis acusações de carácter criminal, insultos, linguagem grosseira ou difamatória, violações da vida privada, incitações ao ódio ou à violência, ou que preconizem violações dos direitos humanos;
-São intoleráveis comentários racistas, xenófobos, sexistas, obscenos, homofóbicos, assim como comentários de tom extremista, violento ou de qualquer forma ofensivo em questões de etnia, nacionalidade, identidade, religião, filiação política ou partidária, clube, idade, género, preferências sexuais, incapacidade ou doença;
-É inaceitável conteúdo comercial, publicitário (Compre Bicicletas ZZZ), partidário ou propagandístico (Vota Partido XXX!);
-Os comentários não podem incluir moradas, endereços de e-mail ou números de telefone;
-Não são permitidos comentários repetidos, quer estes sejam escritos no mesmo artigo ou em artigos diferentes;
-Os comentários devem visar o tema do artigo em que são submetidos. Os comentários “fora de tópico” não serão publicados;