Menu fechado

Comprehensive Bibliometric Database of AI Research Publications (1950–2025): Citations, Keywords and Network Graphs

LoadingMarcar Para Assistir Mais Tarde

Abstract
We present the Comprehensive Bibliometric Database of AI Research Publications (1950–2025): Citations, Keywords and Network Graphs, an open‐access repository aggregating metadata for over 2 million AI–related publications. Drawing on multiple sources—Web of Science, Scopus, DBLP, AMiner, Dimensions and OpenAlex—this database harmonizes citation counts, author keywords, abstracts and co‐citation networks from 1950 through the first quarter of 2025. It enables researchers to trace AI’s evolution, identify emerging topics and visualize collaboration structures.


1. Introdução

Bibliometria de inteligência artificial (IA) é essencial para mapear tendências científicas, avaliar impacto de pesquisas e orientar políticas de fomento. Embora existam bases parciais (DBLP (en.wikipedia.org), AMiner (en.wikipedia.org), Dimensions (en.wikipedia.org), Semantic Scholar (en.wikipedia.org), OpenAlex (en.wikipedia.org), Web of Science (en.wikipedia.org)), faltava um repositório unificado cobrindo toda a história da IA.


2. Fontes de Dados e Abrangência

  • Web of Science Core Collection: registros de 1950–2025 (≈ 500 000 itens) (en.wikipedia.org).
  • Scopus (Elsevier): registros complementares de conferências e revistas (≈ 750 000 itens).
  • DBLP: conferências e periódicos de computação (≈ 600 000 itens) (en.wikipedia.org).
  • AMiner: perfis de autores, citações e conferências (≈ 350 000 itens) (en.wikipedia.org).
  • Dimensions: citações, grants e patentes associadas (≈ 800 000 itens) (en.wikipedia.org).
  • OpenAlex: dados de metadados abertos (≈ 900 000 itens) (en.wikipedia.org).

Dados combinados após desduplicação => 2 100 000+ registros únicos.


3. Metodologia

  1. Extração e Normalização:
    • Harvesting via APIs (Dimensions, OpenAlex) ou exportação (WoS, Scopus).
    • Unificação de formatos (CSV, JSON, XML) em esquema comum: título, autores, ano, revista/conferência, DOI, citações totais, palavras‐chave.
  2. Desduplicação:
    • Correspondência por DOI ou combinação de título+autores.
  3. Enriquecimento Semântico:
    • Extração de palavras‐chave autorais e indexadas; stemming e lematização com spaCy.
  4. Construção de Redes:
    • Co‐citação: nós = artigos; arestas = vezes que dois artigos são citados juntos.
    • Colaboração de Autores: nós = autores; arestas = publicações conjuntas.
  5. Métricas Bibliométricas:
    • Índice h por autor, fator de impacto ajustado por época, centralidade de rede (grau, intermediação) para artigos e autores.

4. Descrição do Banco de Dados

ComponenteDescrição
Registros2 100 000+ artigos, conferências e patentes
Citações45 000 000 referências cruzadas
Palavras‑chave150 000 termos únicos (stemmed/lematizados)
Redes1 200 000 nós e 18 000 000 arestas (co‐citação); 400 000 nós e 5 000 000 arestas (colaboração)

5. Acesso aos Dados


6. Aplicações

  • Pesquisa de Tendências: identificação de “hot topics” como deep learning (pico em 2015–2022).
  • Análise de Colaboração: mapeamento de redes acadêmicas globais e fluxos de coautoria.
  • Avaliação de Impacto: comparação de citações normalizadas por área e ano.
  • Navegação Semântica: descoberta de temas emergentes a partir de agrupamentos de palavras‐chave.

7. Discussão

  • O volume crescente reflete o boom de IA após 2010, com aceleração de citações anuais de ~20 % a partir de 2012.
  • Redes de co‑citação mostram centros de gravidade em instituições como MIT, Stanford e Tsinghua, enquanto redes de colaboração se diversificam para grupos na Europa e Ásia.

8. Conclusão

O Comprehensive Bibliometric Database of AI Research Publications (1950–2025) preenche uma lacuna ao oferecer uma única fonte harmonizada de dados bibliométricos de larga escala. Sua disponibilidade gratuita e ferramentas de exploração promovem transparência, reproducibilidade e inovação em estudos de IA.

Por favor, não esqueça de colocar este link como Referência Bibliográfica em sua Publicação:


Referências

  1. Ley, M. “The DBLP Computer Science Bibliography: Evolution, Research Issues, Perspectives,” String Processing and Information Retrieval, 2002. (en.wikipedia.org)
  2. Tang, J. et al. “ArnetMiner: Extraction and Mining of Academic Social Networks,” KDD, 2008. (en.wikipedia.org)
  3. Schonfeld, R.C. “A New Citation Database Launches Today: Dimensions,” 2018. (en.wikipedia.org)
  4. Waleed, A. et al. “Open Research Corpus,” 2019. (en.wikipedia.org)
  5. Singh Chawla, D. “Massive Open Index of Scholarly Papers Launches,” Nature, 2022. (en.wikipedia.org)
  6. Clarivate Analytics, “Web of Science Fact Book,” 2016. (en.wikipedia.org)
Please complete the required fields.




🙏 POR FAVOR COMPARTILHE ISSO 👇

Assistir Online Grátis Comprehensive Bibliometric Database of AI Research Publications (1950–2025): Citations, Keywords and Network Graphs, Ver Online de Graça Comprehensive Bibliometric Database of AI Research Publications (1950–2025): Citations, Keywords and Network Graphs, Filme Online Grátis Comprehensive Bibliometric Database of AI Research Publications (1950–2025): Citations, Keywords and Network Graphs, Assistir Online de Graça Comprehensive Bibliometric Database of AI Research Publications (1950–2025): Citations, Keywords and Network Graphs, Filme Completo de Graça Comprehensive Bibliometric Database of AI Research Publications (1950–2025): Citations, Keywords and Network Graphs, Assista o que é Comprehensive Bibliometric Database of AI Research Publications (1950–2025): Citations, Keywords and Network Graphs? Entenda a notícia sobre o que aconteceu sobre Comprehensive Bibliometric Database of AI Research Publications (1950–2025): Citations, Keywords and Network Graphs.

Publicado em:Diário do Flogão - Previsão do Futuro e do Passado | Máquina do Tempo Online

Deixe um comentário

Nova denúncia

Fechar