Limite das APIs & Campos & Filtragem
Limite das APIs
Há um limite para quantas solicitações você pode fazer para APIs da Scopus usando sua Chave da API
. Após cada solicitação, a API retornará algumas informações sobre a disponibilidade de sua Chave da API
nos cabeçalhos da resposta. Esse limite de cota é redefinido a cada sete dias.
"X-RateLimit-Limit": "Mostra o limite de cota de solicitações de API",
"X-RateLimit-Remaining": "Mostra a cota restante de solicitação da API",
"X-RateLimit-Reset": "Data/hora em segundos *Epoch* de quando a cota da API será redefinida"
Info
Epoch é o número de segundos decorridos desde 1º de janeiro de 1970, também conhecido como horário Unix.
Cota Excedida
Se a cota de solicitações ou a taxa throttling da API for excedida, você receberá um erro de status HTTP 429: Too Many Requests.
Note
Saiba mais sobre a cota de quantos dados uma Chave da API
pode recuperar.
Mapeamento de Campos
Levando em conta que o objetivo desta aplicação é realizar um levantamento de referenciais teóricos para pesquisa e embasamento de futuros trabalhos acadêmicos, selecionamos um conjunto de informações específicas dos metadados dos artigos.
Campo | Coluna | Descrição |
---|---|---|
link ref=scopus |
Article Preview Page URL | URL da página de visualização do artigo do Scopus |
dc:identifier |
Scopus ID | ID Scopus do Artigo |
authors or dc:creator |
Authors | Lista completa de autores ou apenas o primeiro autor |
dc:title |
Title | Título do artigo |
prism:publicationName |
Publication Name | Título da fonte |
dc:description |
Abstract | Resumo completo do artigo |
prism:coverDate |
Date | Data de publicação |
eid |
Electronic ID | ID Electrônico do Artigo |
prism:doi |
DOI | Identificador de Objeto do Documento |
prism:volume |
Volume | Identificador para uma publicação em série |
citedby-count |
Citations | Contagem de citações |
Note
Veja um exemplo de uma página de visualização de um artigo da Scopus.
Filtrando Resultados
Para fornecer maior consistência, todos os dados passam por três etapas de filtragem:
1. Primeiramente, todas as repetições exatas serão removidas.
2. Em Segundo lugar, todos os resultados com exatos mesmo título e mesmos autores serão removidos.
3. Finalmente, todos os resultados com títulos similares e provenientes dos mesmos autores serão removidos.
Para realizar o terceiro passo, nós iremos selecionar dois ou mais artigos que tenham exatamente os mesmos autores. Depois disso, usaremos a biblioteca TheFuzz, que usa a Distância de Levenshtein, para calcular a similaridade entre os títulos dos artigos desses autores repetidos e, por fim, removeremos os artigos cujos títulos sejam pelo menos 80%
semelhantes.
Artigos que não tenham autores repetidos ou títulos semelhantes serão desconsiderados. Uma mensagem de log será exibida indicando a porcentagem de perda total dos artigos.