sobre


O que é o Conta-me Histórias?
O Conta-me Histórias é um projeto científico que permite aos utilizadores a possibilidade de criarem automaticamente uma sumarização temporal das notícias preservadas pelo Arquivo.pt (http://arquivo.pt).

Criado no âmbito dos Prémios Arquivo.pt 2018, o Conta-me Histórias é uma ferramenta facilmente adaptável a outros tipos de fontes (e.g., patentes, redes sociais, etc) incluindo diferentes línguas. Numa era marcada pela pós-verdade e pelas “fake news”, o Conta-me Histórias é um importante contributo para uma democracia mais transparente, ao permitir a qualquer cidadão (incluindo jornalistas, estudantes, cientistas sociais de áreas como sociologia, ciência política, ciências da comunicação, história, etc.) um acesso livre e democrático a informação contextualizada (assente em fatos e tendencialmente livre de filtros ao fazer uso de diversas fontes jornalísticas).



Como funciona?

O Arquivo.pt preserva milhões de ficheiros recolhidos da web desde 1996 e disponibiliza um serviço público de pesquisa sobre esta informação. Periodicamente recolhe e armazena informação publicada na Web. Este processo de preservação é realizado de forma automática através de um sistema informático distribuído de larga-escala.

Para mostrar os dados do Arquivo.pt, mostramos ao utilizador os excertos mais importantes (nomeadamente títulos noticiosos) de um tópico ao longo do tempo. Para a seleção dos melhores títulos de notícias, recorremos a YAKE! um extrator de palavras-chave desenvolvido pela nossa equipa, e que recentemente foi premiado como Best Short Paper na 40ª edição da European Conference for Information Retrieval (ECIR'18 ).


Adicionalmente, utilizamos o SentiLex-PT01, uma ferramenta de análise de sentimentos para a língua portuguesa desenvolvida por uma equipa de investigadores nacional, utilizada no nosso projeto com o objetivo de analisar o sentimento dos títulos selecionados como relevantes pela YAKE!.


Finalmente, fazemos uso do PAMPO (desenvolvido por elementos da nossa equipa de investigação) com o objetivo de detetar o conjunto de termos relevantes mais relacionados com a pesquisa.



Contribuições

Acreditamos que o Conta-me Histórias é, neste contexto, um importante contributo para uma democracia mais transparente, ao permitir a qualquer cidadão (incluindo jornalistas, estudantes, cientistas sociais de áreas como sociologia, ciência política, ciências da comunicação e história, etc) um acesso livre e democrático a informação contextualizada (assente em fatos e tendencialmente livre de filtros ao fazer uso de diversas fontes jornalísticas).



Origem do nome

O nome ‘Conta-me Histórias’ é uma homenagem à música dos Xutos & Pontapés de mesmo nome, com o intuito de retratar um dos objetivos do projeto, ou seja, o de quereremos contar histórias ao utilizador, que, tal como diz a música, sejam relativas a algo que este não viu ou do qual não se recorda.

Design da apresentação e edição: Livia Stroschoen Pinent


Portais de Notícias

Neste projeto fazemos uso de 24 fontes nacionais de notícias.




Referências acadêmicas

Campos, R., Mangaravite, V., Pasquali, A., Jorge, A., Nunes, C., Jatowt, A. (2018). A Text Feature Based Automatic Keyword Extraction Method for Single Documents. In Proceedings of the 40th European Conference on Information Retrieval (ECIR'18). Grenoble, France, March 26- 29, pp. 684 - 691.

Campos, R., Mangaravite, V., Pasquali, A., Jorge, A., Nunes, C., Jatowt, A. (2018). YAKE! Collection-independent Automatic Keyword Extractor. In Proceedings of the 40th European Conference on Information Retrieval (ECIR'18). Grenoble, France, March 22 - 29, pp. 806 - 810. [Online Demo]
Silva, M., & Carvalho, P., & Costa, C., & Sarmento, L. (2010). Automatic Expansion of a Social Judgment Lexicon for Sentiment Analysis. Technical Report. TR 10-08. University of Lisbon, Faculty of Sciences, LASIGE, December 2010. doi: 10455/6694

Rocha C. , Jorge A., Sionara R., Brito P., Pimenta C., Rezende S. (2016) PAMPO: using pattern matching and pos-tagging for effective Named Entities recognition in Portuguese

Gomes D. and Cruz D. and Miranda J. and Costa M. and Fontes S.: Acquiring and providing access to historical web collections, 10th International Conference on Preservation of Digital Objects, (2013)


Instituições