Prévia do material em texto
UNIVERSIDADE FEDERAL DE PERNAMBUCO - UFPE CENTRO DE ARTES E COMUNICAÇÃO - CAC DEPARTAMENTO DE CIÊNCIA DA INFORMAÇÃO – DCI CURSO DE GESTÃO DA INFORMAÇÃO ELIAS JOSÉ DA SILVA PALAVRAS-CHAVE: RECURSOS PARA REPRESENTAÇÃO DE TENDÊNCIAS TEMÁTICAS DO DOUTORADO DE GEOGRAFIA DA UNIVERSIDADE FEDERAL DE PERNAMBUCO RECIFE 2015 Elias José da Silva PALAVRAS-CHAVE: RECURSOS PARA REPRESENTAÇÃO DE TENDÊNCIAS TEMÁTICAS DO DOUTORADO DE GEOGRAFIA DA UNIVERSIDADE FEDERAL DE PERNAMBUCO Trabalho de Conclusão de Curso apresentado ao Curso de Gestão da Informação do Centro de Artes e Comunicação da Universidade Federal de Pernambuco, como requisito para obtenção do título de Bacharel em Gestão da Informação. Orientador: Prof. Dr.Fábio Mascarenhas e Silva RECIFE 2015 Catalogação na fonte Bibliotecário Jonas Lucas Vieira, CRB4-1204 S586p Silva, Elias José da Palavras-chave: recursos para a representação de tendências temáticas do doutorado em Geografia da Universidade Federal de Pernambuco / Elias José da Silva. – Recife: O Autor, 2015. 64 f.: il., fig. Orientador: Fábio Mascarenhas e Silva. Trabalho de Conclusão de Curso (Graduação) – Universidade Federal de Pernambuco. Centro de Artes e Comunicação. Ciência da Informação, 2016. Inclui referências e apêndice. 1. Ciência da informação. 2. Organização da informação. 3. Representação do conhecimento (Teoria da informação). 4. Ensino superior – Pesquisa. 5. Educação – Estudo e ensino (Pós-graduação). I. Silva, Fábio Mascarenhas e (Orientador). II. Título. 658.4038 CDD (22.ed.) UFPE (CAC 2015-20) AGRADECIMENTOS A Deus, por me conceder a benção da vida, da fé e coragem de ir a luta do sonho. Aos meus pais: Severino José da Silva e Aderita Gomes da Rocha Silva, eternos meninos de engenho, sábios, guerreiros e que de sua forma simples são a base da minha formação humana; Aos meus irmãos Isaias, Iranita e Severo (in memoria) e aos meus sobrinhos os quais sempre dividi as lutas e conquistas; Ao meu estimado Jurandi Donato por dividir comigo os vários momentos da vida, pelos incentivos e pela paciência em me ouvir, ler e discuitir as leituras. Aos meus amigos meio irmãos, Nívea Maria, José Luciano, Gilvanice Marques e Juliano Vidal; A todos os amigos que conviveram e convivem comigo na rotina do trabalho escolar, em especial a Miriam da Paz por conceder os momentos que tanto precisei e a Virginia Lícia pelas palavras de incentivo;. Aos Funcionários do DCI, em especial Jorge e Tereza pelo constante prazer e simpatia ao atender. Aos Professores do Curso de Gestão da Informação que colaboraram diretamente e indiretamente na minha formação, em especial a Luciana Vidal, Fábio Pinho, Vildeane Borba, Raimundo Nonato, Nadi Helena, André Fell e Maria Cristina . Aos colegas da segunda turma do Curso de Gestão da Informação, em especial a Valquíria, Fabio, Ivanildo, Fernando, Neuton e Ciro por dividir as alegrias, dilemas e expectativas como estudantes desbravadores de um curso em ascensão. Ao meu orientador Prof. Fábio Mascarenhas e Silva, pelas palavras de ânimo, a quem estimo respeito e admiração pelo modelo de profissional humanizado e que não desistiu de mim em nenhum momento, meus sinceros agradecimentos. Elias José. SILVA, Elias José. Palavras-chave: Recursos para representação de Tendências Temáticas do Doutorado de Geografia da Universidade Federal de Pernambuco. 2015. 64. f. Trabalho de Conclusão de Curso (Bacharelado em Gestão da Informação) – Departamento de Ciëncia da Informação, Universidade Federal de Pernambuco. Recife, 2015. RESUMO: O presente Trabalho visou verificar a possibilidade do uso de palavras-chave como recurso para representação das tendências temáticas do Curso de Doutorado do Programa de Pós-graduação de Geografia (PPGEO) da Universidade Federal de Pernambuco (UFPE). Analisaram-se e compararam-se três conjuntos de palavras- chave que fazem referência às teses defendidas entre 2008 e 2014. O primeiro conjunto de palavras-chave trata das que foram citadas pelos autores nos resumos de suas teses; o segundo constitui-se de palavras-chave que foram indexadas às teses quando armazenadas no Repositório Informacional (RI) da UFPE; e o terceiro conjunto refere-se às palavras-chave presentes na ficha catalográfica das teses. Para tanto, realizou-se um estudo bibliográfico para nortear as questões de identidade da Ciência da Informação e seu objeto de estudo, em particular, a informação científica, bem como os referenciais teóricos que abordam sobre a representação e organização da informação e do conhecimento, e a função das palavras-chave nesse processo. As nuvens de palavras foram ferramentas elencadas para visualização das palavras-chave citadas nos três conjuntos acima descritos. Constatou-se que as palavras-chave da ficha catalográfica, diante do seu caráter de linguagem controlada, exercem o papel, exclusivo, de auxiliar nos processos de identificação da área geral de conhecimento e o da localização física do documento. Verificaram-se semelhanças entre as palavras-chave atribuídas às teses no RI da UFPE e as atribuídas pelos autores nos resumos, demonstrando o predomínio de termos da linguagem natural no repositório. O uso da única ferramenta de visualização atendeu os objetivos da pesquisa, no entanto, limitou as análises mais aprofundadas e representou-se um panorama temático, em vez da tendência temática. Sugere-se que relações entre as palavras-chave e entre elas e as linhas de pesquisa de um programa de pós-graduação podem enriquecer a pesquisa. Palavras-chave: Representação da informação e do conhecimento; Gestão da Informação; Repositório; Palavra-chave; Nuvem de palavra; Geografia; SILVA, Elias José. Keywords: Resources for representation trends theme in Geography Course Doctoral of Universidade Federal de Pernambuco. 2015. 64. f. Trabalho de Conclusão de Curso (Bacharelado em Gestão da Informação) – Departamento de Ciëncia da Informação, Universidade Federal de Pernambuco. Recife. Brazil, 2015. ABSTRACT: This research aimed to verify the possibility of using keywords as a resource for representation of thematic trends Doctoral Course Geography (PPGEO) of the Universidade Federal de Pernambuco (UFPE). Analyzed and compared three sets of keywords, as its source, that reference to theses between 2008 and 2014. The first set of keywords comes from those cited by the authors in the summaries of their theses; the second is made up of keywords that have been indexed to the theses when stored in Informational Repository (IR) of UFPE; and the third set refers to the keywords present in the card catalog of the theses. For this, we used a bibliographical study to guide the science questions of identity information and its subject matter, in particular, scientific information, as well as the theoretical frameworks that address on the representation and organization of information and the role of Keywords in this process. The tag clouds were listed tools for keywords of view. It was found that the keywords of the catalog card, before his character symbolic language, play the role, unique, to assist in the identification process of the general area of knowledge and the physical location of the document. There were similarities between the keywords assigned to the theses in RI UFPE and assigned by the authors in the abstract, showing the predominance of terms of natural language in the repository. Using the unique visualizationtool has met the objectives of the research, however: limited the further analysis and is represented an overall view rather than the thematic trend. It is suggested that relationships between keywords and between them and the research lines of a post graduate program can enrich the research. Keywords: Information Representation and knowledge; Information management; Repository; Keyword; Tag cloud; Geography; LISTA DE FIGURAS Figura 1: PÁGINA INICIAL DO RI DA UFPE ................ Erro! Indicador não definido. Figura 2: COLEÇÕES DE ITENS POR COMUNIDADE DO PPGEO DA UFPE .. Erro! Indicador não definido. Figura 3: FILTROS DE BUSCA DO RI DA UFPE ........ Erro! Indicador não definido. Figura 4: USO DO FILTRO DE BUSCA POR DATA DO DOCUMENTO ............. Erro! Indicador não definido. Figura 5: DESCRIÇÃO FÍSICA E TEMÁTICA DO DOCUMENTOErro! Indicador não definido. Figura 6: LOCALIZAÇÃO DAS PALAVRAS-CHAVE ATRIBUIDAS AO DOCUMENTO NO RI DA UFPE ........................................................... Erro! Indicador não definido. Figura 7: LOCALIZAÇÃO DAS PALAVRAS-CHAVE NA FICHA CATALOGRÁFICA ..................................................................................... Erro! Indicador não definido. Figura 8: LOCALIZAÇÃO DAS PALAVRAS-CHAVE NO RESUMO DA TESE .... Erro! Indicador não definido. Figura 9: TESES ARMAZENADAS EM BASE DE DADOS PESSOALErro! Indicador não definido. Figura 10: PÁGINA INICIAL DO SITE TAGCROWD .... Erro! Indicador não definido. Figura 11: REPRESENTAÇÃO DOS TERMOS NATURAIS DAS TESES DEFENDIDAS EM 2008 ............................................... Erro! Indicador não definido. Figura 12: REPRESENTAÇÃO DOS TERMOS DA FICHA CATALOGRÁFICADAS TESES DEFENDIDAS EM 2008 .................................. Erro! Indicador não definido. Figura 13: REPRESENTAÇÃO DOS TERMOS NATURAIS DAS TESES DEFENDIDAS EM 2009 ............................................... Erro! Indicador não definido. Figura 14: REPRESENTAÇÃO DOS TERMOS DA FICHA CATALOGRÁFICA DAS TESES DEFENDIDAS EM 2009 .................................. Erro! Indicador não definido. Figura 15: REPRESENTAÇÃO DOS TERMOS NATURAIS DAS TESES DEFENDIDAS EM 2010 ............................................... Erro! Indicador não definido. Figura 16: - REPRESENTAÇÃO DOS TERMOS DA FICHA CATALOGRÁFICA DAS TESES DEFENDIDAS EM 2010 .................................. Erro! Indicador não definido. Figura 17: REPRESENTAÇÃO DOS TERMOS NATURAIS DAS TESES DEFENDIDAS EM 2011 ............................................... Erro! Indicador não definido. Figura 18: REPRESENTAÇÃO DOS TERMOS DA FICHA CATALOGRÁFICA DAS TESES DEFENDIDAS EM 2011 .................................. Erro! Indicador não definido. Figura 19: REPRESENTAÇÃO DOS TERMOS NATURAIS DAS TESES DEFENDIDAS EM 2012 ............................................... Erro! Indicador não definido. Figura 20: REPRESENTAÇÃO DOS TERMOS DA FICHA CATALOGRÁFICA DAS TESES DEFENDIDAS EM 2012 .................................. Erro! Indicador não definido. Figura 21: REPRESENTAÇÃO DOS TERMOS NATURAIS DAS TESES DEFENDIDAS EM 2013 ............................................... Erro! Indicador não definido. Figura 22: REPRESENTAÇÃO DOS TERMOS DA FICHA CATALOGRÁFICA DAS TESES DEFENDIDAS EM 2013 .................................. Erro! Indicador não definido. Figura 23: - REPRESENTAÇÃO DOS TERMOS NATURAIS DAS TESES DEFENDIDAS EM 2015 ............................................... Erro! Indicador não definido. Figura 24: REPRESENTAÇÃO DOS TERMOS DA FICHA CATALOGRÁFICA DAS TESES DEFENDIDAS EM 2014 .................................. Erro! Indicador não definido. Figura 25: NUVEM DE PALAVRAS DAS PALAVRAS-CHAVE DOS RESUMOS DAS TESES. ........................................................................ Erro! Indicador não definido. Figura 26: NUVEM DE PALAVRAS DAS PALAVRAS-CHAVE DAS TESES NO RI DA UFPE. ..................................................................... Erro! Indicador não definido. Figura 27: NUVEM DE PALAVRAS DAS PALAVRAS-CHAVE ATRIBUÍDAS NAS FICHAS CATALOGRÁFICAS DAS TESES. ................. Erro! Indicador não definido. LISTA DE QUADROS Quadro 1: COMPARAÇÃO DAS VANTAGENS E DESVANTAGENS DA LINGUAGEM NATURAL (LN) E DA LINGUAGEM CONTROLODA (LC) ............ Erro! Indicador não definido.2 Quadro 2: ÁREA DE CONCENTRAÇÃO E LINHAS DE PESQUISA DO PPGEO DA UFPE .......................................................................... Erro! Indicador não definido.7 Quadro 3: TESE EM DUPLICIDADE NO RI DA UFPEErro! Indicador não definido.5 Quadro 4: TESE ARMAZENADA NO RI COM TÍTULO DIVERGENTE DA OBRA FÍSICA ........................................................................ Erro! Indicador não definido.5 Quadro 5: EXEMPLO DA ORGANIZAÇÃO DAS PALAVRAS-CHAVE PARA GERAÇÃO DE NUVENS DE PALAVRAS ................ Erro! Indicador não definido.40 Quadro 6: PALAVRAS-CHAVE ATRIBUIDAS PELOS AUTORES DAS TESES DEFENDIDAS EM 2008 ................................................................................. Erro! Indicador não definido.43 LISTA DE SIGLAS BD - BIBLIOTECA DIGITAL BDTD - BIBLIOTECA DIGITAL DE TESES E DISSERTAÇÕES CAPES - COORDENAÇÃO DE APERFEIÇOAMENTO DE PESSOAL DE NIVEL SUPERIOR CDD - CLASSIFICAÇÃO DECIMAL DE DEWEY CFCH - CENTRO DE FILOSOFIA E CIENCIAS HUMANAS CI - CIËNCIA DA INFORMAÇÃO CTG - CENTRO DE TECNOLOGIA E GEOCIËNCIAS ENANCIB - ENCONTRO NACIONAL DE PESQUISA EM POS GRADUAÇÃO EM CIENCIA DA INFORMAÇÃO FURG UNIVERSIDADE FEDERAL DO RIO GRANDE GI - GESTÃO DA INFORMAÇÃO IFES - INSTITUIÇÃO FEDERAL DE ENSINO SUPERIOR LC - LINGUAGEM CONTROLADA LN - LINGUAGEM NATURAL MEDILINE - MEDICAL LITERATURE ANALYSIS AND RETRIEVAL SYSTEM ON LINE MeSH - MEDICAL SUBJECT HAADINGS OAIS OPEN ARCHIVAL INFORMATION SYSTEM PPG PROGRAMA DE POS GRADUAÇÃO PPGEO - PROGRAMA DE POS GRADUAÇÃO EM GEOGRAFIA RI - REPOSITORIO INFORMACIONAL TCC - TRABALHO DE CONCLUSÃO DE CURSO UFPE - UNIVERSIDADE FEDERAL DE PERNAMBUCO SUMÁRIO 1 INTRODUÇÃO 11 2 FUNDAMENTAÇÃO TEÓRICA 14 2.1 A Ciência da Informação e seu Objeto de Estudo 14 2.2 A Representação e Organização da Informação: Bases Conceituais 18 2.2.1 Palavras-Chave: Conceitos e Definições 20 3 PROCEDIMENTOS METODOLÓGICOS 26 3.1 Caracterização do Programa de Pós-Graduação em Geografia da UFPE (PPGEO da UFPE) 26 3.2 Características do Repositório Informacional da UFPE (RI da UFPE) 28 3.3 A Coleta das Teses no RI da UFPE 31 3.4 A Organização e a Representação Visual das Palavras-Chave 40 4 ANÁLISE DOS RESULTADOS 43 4.1 Primeira Análise 44 5 CONSIDERAÇÕES FINAIS 53 UFRJ - UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USP - UNIVERSIDADE DE SÃO PAULO REFERÊNCIAS 56 11 1 INTRODUÇÃO Na obra A sociedade em rede, Castells (2000) diferencia a sociedade industrial da atual pós-industrial ao afirmar que esta ancora-se na economia informacional para estabelecer seus meios de produção, e Santos (2000) corrobora afirmando que este período, denominado por ele de técnico-científico-informacional, é marcado pela necessidade crescente da relação entre ciência e tecnologia para o alcance do progresso. No entanto, comunicar os resultados alcançados nos diversos canais informacionais, hoje disponíveis, ganha relevância, pois o que é produzido cientificamente num dado período de tempo tem relações diretas com o desenvolvimento de uma sociedade. Neste contexto, a Ciência da informação (CI) colabora com as demais áreas exercendo uma das suas finalidades que é a disseminação do seu objeto de estudo (a informação), e para tanto, a sua organização e a sua representação são aspectos essenciais para que o conhecimento construídopela humanidade seja melhor recuperado, visualizado, divulgado e (re)significado. No caso da informação científica, enquanto insumo para a ciência e a tecnologia, ressalta-se a importância do partilhamento, da validação e da colaboração desta aos demais pesquisadores. Esse tipo de informação se renova na comunidade que tem interesse nela, por meio da sua comunicação nos eventos científicos e registrada em documentos. Dessa maneira, os documentos de cunho científico também se caracterizam como objeto de interesse da CI diante da necessidade dos mesmos serem identificados, organizados e recuperados com maior precisão. Nesse aspecto, a indexação dos documentos por meio de palavras-chave nas bases de dados tanto físicas quanto as digitais tem sido amplamente utilizada não apenas para facilitar a recuperação, como também para representar o conteúdo do documento a partir da visão e da linguagem dos autores. Assim, a questão central desta pesquisa foi: Seria possível utilizar as palavras-chave atribuídas à teses para constituir um mapa temático de um Programa de Pós-graduação? Para este estudo pressupôs que seria sim possível fazer uso de palavras como forma de representação da memória científica de uma determinada área do 12 conhecimento, pelo fato delas serem signos representativos do conteúdo do conhecimento registrado, ou seja, do documento. Para tanto, o presente Trabalho de Conclusão de Curso (TCC), do Bacharelado em Gestão da Informação (GI) da Universidade Federal de Pernambuco (UFPE), tem como objetivo Geral representar, através de nuvem de palavras, as tendências temáticas do Curso de Doutorado do Programa de Pós- graduação de Geografia (PPGEO) da UFPE, defendidas entre 2008 e 2014, a partir da análise e comparação de três conjuntos de palavras-chave referentes às suas Teses. O primeiro conjunto trata das palavras-chave utilizadas pelos autores nos resumos de suas teses; o segundo constitui-se de palavras-chave que foram indexadas às teses quando armazenadas no Repositório Informacional (RI) da referida Instituição Federal de Ensino Superior (IFES); e o terceiro conjunto refere-se às palavras-chave presentes na ficha catalográfica das teses, as quais resultam das linguagens controladas, como por exemplo, a Classificação Decimal de Dewey (CDD), ou Classificação Decimal Universal (CDU). Inicialmente a proposta desta pesquisa limitava-se a analisar as palavras- chave citadas pelos autores nos resumos de suas teses. Mas, no percurso da investigação percebeu-se que durante a organização das palavras-chave, numa base de dados pessoal, curiosamente, verificou-se que a maioria destas era a mesma das que foram adotadas na indexação das Teses no RI da UFPE e que estas se diferenciavam das que foram atribuídas na ficha catalográfica das mesmas. Isso instigou a considerar não apenas os termos propostos pelos autores, mas também a estudar os adotados no Sistema de Informação Institucional e na ficha catalográfica. A identificação das palavras-chave nos três conjuntos citados, mapear os temas e visualizá-las por meio das nuvens de palavras configuram-se como objetivos específicos. A escolha do tema para desenvolvimento deste TCC demonstrou-se desafiador pelos seguintes motivos: A possibilidade de se construir um perfil de tendências temáticas, por meio do uso de palavras-chave das teses de um dos importantes centros de pesquisa geográfica do Brasil e do Nordeste brasileiro (área de minha primeira formação superior). Pela possibilidade da inserção do autor deste trabalho no campo da pesquisa em Ciência da Informação (área de minha segunda formação superior). 13 Este TCC estrutura-se em cinco seções, sendo a introdução a primeira. A segunda trata do referencial teórico o qual se configura numa exploração bibliográfica. Foram consultados livros, artigos de periódicos e teses, para embasar as questões referentes à Ciência da Informação e seu objeto de estudo, as especificidades da informação científica, alguns conceitos que tratam da representação do conhecimento e da informação, bem como reflexões teóricas acerca das palavras-chave, as quais estão inseridas na análise e representação documental. Os procedimentos metodológicos constam na terceira seção, onde apresenta, brevemente o Programa de Pós-graduação de Geografia da UFPE (PPGEO da UFPE), e em particular o Curso de Doutorado. Aborda sobre o RI, sua importância e gerenciamento da informação da produção científica nele existente. Nesta mesma seção demonstra-se o passo a passo do acesso a base de dados online da IFES e a coleta das teses, bem como a organização das palavras- chave. Encerra com uma breve abordagem conceitual sobre Nuvem de Palavras (Tags Clouds) e o sua importância para visualização dos termos empregados, os quais representam as temáticas do Curso de Doutorado do PPGEO-UFPE. A quarta seção ficou reservada para uma discussão e análise dos resultados visualizados pelas nuvens de palavras e a quinta com as considerações finais. 14 2 FUNDAMENTAÇÃO TEÓRICA Esta seção consiste em realizar uma revisão do tema, sob o aspecto teórico, realizado em pesquisas e trabalhos cientificamente confiáveis (ECO, 2010; LAKATOS; MARCONI, 2001; MARION; DIAS; TRALDI, 2002). Para tanto, livros, artigos de periódicos e teses foram consultados para nortear as questões de identidade da Ciência da Informação e seu objeto de estudo (BARRETO, 2007; BORKO, 1968; LE COADIC, 1996; MIRANDA, 2002; ROBREDO, 2003), em particular, a informação científica (SANTOS et al., 2007; SANTOS; KOBASHI, 2009; SILVA; SMIT, 2008), bem como os referenciais teóricos que abordam sobre a representação do conteúdo do conhecimento científico (BRASCHER; CAFÉ, 2008; FUJITA et al., 2009; NOVELLINO, 1996;) e a função das palavras-chave nesse processo (BORBA; VAN DER LAAN; CHINI, 2012; FERREIRA, 2012; MIGUÉIS et al., 2013). 2.1 A Ciência da Informação e seu Objeto de Estudo Definições do termo ‘informação’ são apresentadas por pesquisadores de diferentes áreas, o que por vezes resultam em conceitos evasivos e controversos, até mesmo utilizado como sinônimo de conhecimento. A questão terminológica envolvendo os termos informação e conhecimento também é apontada por Bräscher e Café (2008) no intuito de diferenciá-los no âmbito da Ciência da Informação (CI). Apesar de não ter ainda uma definição esclarecida, nem esclarecedora, a literatura em CI apresenta diversas definições do seu objeto de estudo (a informação) e assim a sua definição ainda se encontra num processo em consolidação. Por este motivo e outros, a CI travou, desde a sua origem, dificuldades diante das outras áreas de conhecimento de se firmar e ser reconhecida enquanto Ciência. Num artigo bastante conhecido e clássico, sob o título Information Science – what is it? Borko (1968) bem que procurou caracterizar, delimitar e apontar o objeto de estudo da CI ao ter afirmado que ela: [...] investiga as propriedades e o comportamento da informação, as forças que regem o fluxo informacional e os meios de processamento da informação para a otimização do acesso e uso. Está relacionado com um 15 corpo de conhecimento que abrange a origem, coleta, organização, armazenamento, recuperação, interpretação, transmissão, transformação e utilização da informação. Isto inclui a investigação, as representações da informação tanto no sistema natural, como no artificial, o uso de códigos para uma eficiente transmissão de mensagens e o estudo dos serviços e técnicas de processamento da informação e seus sistemas de programação. Trata-se de uma ciência interdisciplinar derivada e relacionada com vários campos como a matemática, a lógica, a lingüística, a psicologia, a tecnologia computacional, as operações de pesquisa, as artes gráficas, as comunicações,a biblioteconomia, a gestão e outros campos similares. (BORKO, 1968, p.3, traduzido por ROBREDO, 2003, p.56-57).1 Para Miranda (2002, p.10), “o problema da nova ciência estaria na definição de ‘informação’ que, conforme as origens profissionais dos especialistas teriam sentidos e conotações próprias e diferenciadas”. Le Coadic (1996) reconhece o crescimento do volume de informação, ou explosão da informação, como o elemento primordial para a gênese da CI, marcadamente notada após a segunda guerra mundial. O autor afirma que a CI, enquanto Ciência, realizar uma: [...] produção consciente da espécie humana com origens bem precisas, um objeto e um conteúdo bem definidos e especialistas facilmente identificáveis. Suas origens são recentes: 1968, data de nascimento da primeira grande sociedade cientifica nos Estados Unidos, a American Society for Information Science (ASIS). Tem, portanto, um quarto de século, tempo de uma geração, o que é também uma idade adulta. A ciência da informação tornou-se uma ‘ciência adulta’, que conta com uma definição do seu objeto de estudo, métodos, alguns conceitos básicos, leis fundamentais, etc. Enfim, refere-se cada vez mais à sua própria história, o que é sinal de maturidade. Seu objeto é uma matéria, a informação. Trata-se de recurso vital do qual ainda não se mediu suficientemente a extensão dos usos e não-usos, por falta de atenção com seus usuários. Seu conteúdo, marcado pelo selo da interdisciplinaridade, é uma sábia dosagem de ciências matemáticas e físicas, bem como ciências sociais e humanas. (LE COADIC, 1996, p. 109). 1 […] investigates the properties and behavior of information, the forces governing the flow of information, and the means of processing information for optimum accessibility and usability. It is concerned with that body of knowledge relating to the origination, collection, organization, storage, retrieval, interpretation, transmission, transformation, and utilization of information. This includes the investigation of information representations in both natural and artificial systems, the use of codes for efficient 2 3 message transmission, and the study of information processing devices and techniques such as computers and their programming systems. It is an interdisciplinary science derived from and related to such fields as mathematics, logic, linguistics, psychology, computer technology, operations research, the graphic arts, communications, library science, management, and other similar fields. (Borko, 1968, 3). 16 Mesmo de forma modesta, a importância da CI para a sociedade tem sido demonstrada desde então. Seus principais objetivos vão desde o estudo das propriedades gerais da informação, passando pela análise e seus processos de construção, comunicação, até o uso da mesma. Sobre as características da Ciência da Informação (CI), Novellino (1996) acrescenta que: A Ciência da Informação é uma disciplina voltada para o estudo de fenômenos subjacentes à produção, circulação e uso da informação. O estudo desses fenômenos tem como finalidade possibilitar a criação de instrumentos e o estabelecimento de metodologias que viabilizem a transferência de informações. (NOVELLINO, 1996, p.37). Bräscher e Café (2008, p.107) acrescentam que a CI de fato caracteriza-se pela perspectiva interdisciplinar, estruturada num “[...] corpus teórico próprio, mas para afirmar-se como legítimo, precisa também travar relações com outras áreas”, que em seu estudo elas escolheram o termo ‘interfaces’, em vez de interdisciplinaridade, para referir-se a atividade da CI a qual conflui na mesma direção de algumas outras áreas, porém cada uma detentora de um acervo prático e teórico específico. Apresentados as definições da CI cabe apontar os entendimentos e conceitos do seu objeto de estudo. Nesse sentido, Capurro e Hjørland (2007 apud FERREIRA, 2012, p.24) colaboraram com um extenso trabalho no qual, “[...] entre muitas colocações, escreveram que o conceito de informação deveria ser elaborado, considerando contextos”. Souza (2007) corrobora ao explicitar que estes diferentes contextos (no científico, no tecnológico, no educacional, no político, no artístico e cultural) a informação é um produto do homem, sendo a chave e a matéria-prima para a aquisição e (re)construção do conhecimento. Para Barreto (2007), conhecer é ato de interpretação individual, apropriação do objeto informação pelas estruturas mentais de cada sujeito. Em suma, é a modificação do seu estoque mental após a interação com uma nova forma de informação. Robredo (2007) acrescenta que a informação pode ser registrada, duplicada, transmitida, armazenada, organizada, processada e codificada pela linguagem natural (falada ou escrita), seguindo normas e padrões (gramática, sintaxe) próprios 17 de cada língua, ou de outras linguagens criadas pelo homem. Informação seria então o conhecimento externalizado mediante algum tipo de codificação. Buckland (1991) identifica três principais usos da palavra informação para classificar as atividades a ela relacionadas. O primeiro e o segundo apresentam a informação como intangíveis, por gerarem apenas conhecimentos tácitos, que dificilmente podem ser percebidos, manipulados ou recuperados por sistemas de informação. Inicialmente, a “informação-como-processo”, a qual equivale ao ato de informar, de comunicar algo a alguém, de narrar algo e proporcionar modificações no saber do indivíduo. Em seguida, a “informação-como-conhecimento”, aquela que é percebida a partir da informação como processo, ou seja, assimilada e compreendida. Por fim, o terceiro uso aborda a “informação-como-coisa”, a informação registrada em qualquer suporte, entidade tangível e possível de ser tratada por sistemas de informação. Este termo seria, portanto, aplicado aos documentos, livros e qualquer tipo de objeto que possa ter valor informativo, o que, em princípio, literalmente pode ser qualquer coisa, desde que tenha a qualidade de conhecimento comunicado, materializado. Enfim, a informação existe e isso é fato. Sua comunicação, seleção ou agregação de valor é que lhe conferem uma existência visível, palpável e mensurável às pessoas e pelas pessoas. Dessa maneira, as teses defendidas no PPGEO desempenham um papel fundamental neste TCC, as quais se classificam como informação cientifica registrada e validada por pesquisadores. Portanto, a informação-como-coisa é o conceito que mais se coaduna com o escopo desta pesquisa. A informação científica resulta das pesquisas e serve como insumo básico para o desenvolvimento científico e tecnológico de um país. Macias-chapula (1998) e Santos et al. (2007) afirmam que os dados estatísticos da produção cientifica caracterizam-se como instrumentos indispensáveis para a tomada de decisão na política científica, em especial em relação às prioridades a serem estabelecidas nos Programas de Pós-graduação. Santaella (2001, p.46-47) aponta que “a) não há comunicação sem transmissão de informação; b) não há informação que não seja encarnada numa mensagem; c) não há mensagem sem signos; d) não há transmissão de mensagem sem canal de transporte”. Para tanto, comunicar e refletir sobre a produção e circulação dos conhecimentos científicos, nos diversos canais informacionais hoje disponíveis, ganha relevância. 18 Assim, as teses podem revelar aspectos importantes da atividade cientifica de um país, de uma instituição, ou de um grupo de pesquisadores, servindo de matéria- prima para a geração de novos conhecimentos científicos e tecnológicos. Conforme Santos et al. (2007), conhecer em profundidade as características e hábitos de cada setor, elaborar hipóteses plausíveis, fazer uso de metodologias de coleta e análise que produzam resultados confiáveis são primordiais. No casoparticular do desenvolvimento desta pesquisa, a representação do conhecimento produzido no Curso de Doutorado do PPGEO da UFPE, o qual está registrado nas teses, demonstra ser uma atividade contribuidora nos domínios da CI no momento em que “[...] toma por objeto a informação a partir da sua geração, participando da sua seleção, tratamento e disseminação nas instituições [...]”. (FERREIRA, 2012. p. 19). 2.2 A Representação e Organização da Informação: Base Conceitual Alvarenga (2006, p.5) parte da definição de que “representar significa o ato de colocar algo no lugar de” e nesse sentido, as representações são artifícios que o homem criou para conseguir captar a vastidão e complexidade do conhecimento construído. Dessa maneira, as representações assumem aspectos essenciais para que o conhecimento seja melhor recuperado, visualizado, divulgado e (re)significado. (DODEBEI, 2002; VITAL, 2010). Em seu sentido amplo, Bettencourt (2014, p.52) traz o conceito de representação, “o qual é encontrado na teoria das ciências cognitivas tratando o tema da representação mental, mediante a qual o sujeito organiza o seu conhecimento”. No estudo das interfaces entre a CI e outras áreas, Bräscher e Café (2008, p.115) complementam afirmando que os estudos sobre a representação do conhecimento se aproximam do paradigma cognitivo, na medida em que as linguagens documentárias, a classificação e a análise de assunto são interfaces entre a CI e a Semiótica, a Lingüística, a Arquivologia e a Biblioteconomia, em função das características instrumentais dessas áreas quando se estuda a terminologia em sistemas de indexação permeados pelas TICs. Novellino (1996) aponta em seu artigo que a CI se volta para a organização da informação, a qual também diz respeito à sua representação. 19 Quanto à delimitação dos conceitos de organização e representação da informação (OI/RI) e organização e representação do conhecimento (OC/RC), Bräscher e Café (2008) esclarecem que: a organização da informação é um processo que envolve a descrição física e de conteúdo dos objetos informacionais. O produto deste processo descritivo é a representação de determinado objeto informacional, enquanto que a organização do conhecimento, caracterizadas pelos conceitos, classificações e relacionamentos visa à construção de modelos de mundo que se constituem em abstrações da realidade. (BRASCHER; CAFÉ 2008, p.6) No contexto desta pesquisa, adota-se a proposta conceitual de Novellino (1996) pois esclarece que: A principal característica do processo de representação da informação é a substituição de uma entidade lingüística longa e complexa - o texto do documento - por sua descrição abreviada. O uso de tal ]sumarização não é apenas uma conseqüência de restrições práticas quanto ao volume de material a ser armazenado e recuperado. Essa sumarização é desejável, pois sua função é demonstrar a essência do documento. Ela funciona então como um artifício para enfatizar o que é essencial no documento. (NOVELLINO, 1996, p.38). Estas tarefas, organização e representação, envolvem o tratamento da informação, as quais não podem alterar o conteúdo da mesma, porém pode criar novas informações a partir dela. Silva (2007) afirma que o processo de tratamento da informação é feito a partir de metodologias formalizadas de reconhecimentos temáticos e descritivos do conhecimento inscritos num suporte documental. 20 2.2.1 Palavras-Chave: Conceitos e Definições A partir do momento em que o homem passou a ser capaz de pensar e de falar, ele fez uso das palavras, do conjunto de símbolos, de signos e sinais para designar os objetos e para traduzir os pensamentos formulados sobre os mesmos (DAHLBERG, 1978). Na oralidade, o homem encontrou na memória os princípios da organização de seus saberes. Mais tarde, a escrita surgiu em consequência da necessidade de se perenizar o conhecimento e de organizá-lo fora da memória. A escrita passou a ter a função de imprimir as informações e de possibilitar a comunicação através do tempo, diante do poder que as palavras têm de deter um significado. De acordo com Hudon (2010), “as palavras nunca podem ser completamente isoladas do sistema lingüístico que pertencem, nem da origem em que elas foram criadas”. O que ratifica o valor delas é a vigência do seu significado, pois, para a autora, “[...] as palavras não são passivas e nem neutras [...]”.2 (HUDON, 2010, p.146). Borba, Van de Laan e Chini (2012, p.28) acrescentam que “[...] o estudo das palavras-chave só pode ser compreendido com o auxílio do estudo da língua”, e assim a ideia de palavras-chave vai mais além, pois estas são signos, conjunto de palavras, que representam um documento e seu conteúdo sem necessariamente fazer uma leitura total dele. Numa definição simples, palavra-chave é a palavra que traduz o sentido de um contexto, que o torna claro e o identifica, ou ainda, é a palavra que identifica elementos correlatos ou que pertençam à mesma área de interesse para fins de pesquisa (HOUAISS, 2001, p. 2108). De uma maneira geral, as palavras-chave configuram-se como resultado, produto decorrente de um processo de representação de conteúdos. Cunha e Cavalcanti (2008, p.274) definem a palavra-chave como a “palavra significativa encontrada no título de um documento, no resumo ou no texto. Essa palavra (ou grupo de palavras) caracteriza o conteúdo temático do item e é usada em catálogos e índices de assuntos”. Nesta definição, a palavra-chave cumpre simultaneamente o papel de representar a informação e o de recuperá-la. 2 “Words can never be completely isolated from their context, from the linguistic system to which they belong, from the culture that has created them”. “ […]”. “Words are not passive and neutral. They are powerful […].” (HUDON, 2010, p.146. Tradução do autor). 21 As palavras-chave citadas pelos autores nos trabalhos científicos, normalmente, são extraídas do próprio documento e neste TCC considera-se que tais palavras fazem parte da Linguagem Natural (LN), termo que “[...] não significa outra coisa que a linguagem do discurso comum”. (LANCASTER, 2002, p.177 apud GODINHO, 2014, p.33). Em um sistema de recuperação com linguagem natural, o assunto dos documentos e as necessidades de informação estão representados por um vocabulário ilimitado de palavras e frases utilizadas habitualmente no campo temático, a qual pode gerar uma riqueza de compreensões, visto que a linguagem humana é caracterizada pela polissemia vocabular. (CINTRA et al., 2002). O antônimo de linguagem natural é linguagem controlada (LC), ou seja, um limitado conjunto de termos, o qual se aproxima, portanto, do âmbito das Linguagens Documentárias (LD). Trata-se de um produto que se de define como uma linguagem artificial, assim chamada porque não é resultado do processo evolutivo natural e necessita de regras explícitas para o seu uso (CINTRA et al., 2002). E nesse aspecto Tomás-Casterá (2009, apud Ferreira, 2012, p.43), usa o termo “descritores”, para se referir a termos unívocos, cuja característica é o controle de vocabulário, normalizados e estruturados de forma hierárquica. Ferreira (2012) orienta que para a palavra-chave tornar-se um descritor ela tem que passar por um rígido controle de sinônimos, significado e importância na árvore de um determinado assunto. As palavras-chave presentes na ficha catalográfica de um documento resultam da ordenação de termos conforme o sistema de classificação bibilográfica adotada. Marshal (2009, p.25) apresenta em sua monografia as linguagens documentárias, seus tipos e funções. A autora acrescenta que nos “[...] sistemas de clasiificação bibliográfica, os assuntos são representados por códigos ou símbolos”, empregadosem sua maioria para ordenação de classes de assunto e localização física do documento. Rowley (2002, p. 170-171) contribui ressaltando que “[...] tanto as linguagens controladas quanto às naturais são amplamente utilizadas na recuperação de informações [...]” e aponta que não foi possível comprovar que uma seja mais eficiente do que a outra. A respeito disso, Godinho (2014) apresenta em sua dissertação as vantagens e desvantagens dessas linguagens, as quais podem ser visualizadas no quadro 1. 22 Quadro 1: COMPARAÇÃO DAS VANTAGENS E DESVANTAGENS DA LINGUAGEM NATURAL (LN) E DA LINGUAGEM CONTROLODA (LC) VANTAGENS LN LC Baixo custo; Processo de buscas simplificado; Possível fazer buscas no conteúdo total da base de dados; Toda palavra tem valor de recuperação igual; Sem erros humanos de indexação; Sem demora na incorporação de termos novos Resolve muitos problemas semânticos; Permite que relações de gênero-espécie sejam identificadas; Mapeia áreas do conhecimento DESVANTAGENS Maior carga de trabalho para o indexador; Podem-se perder informações que estejam incluídas implícita mas não explicitamente no texto; Ausência de vínculos do genérico para o específico; É preciso conhecer o vocabulário da disciplina. Custo alto; Possíveis inadequações de cobertura; Erro humano; Possibilidade de vocabulário desatualizado; Dificuldade de incorporar sistematicamente todas as relações relevantes entre os termos. Fonte: Godinho (2014, p.34). A partir da análise desse quadro pode-se observar que tanto uma linguagem quanto a outra podem ter efeitos negativos na eficácia da recuperação da informação. O uso da linguagem natural (não-controlada) pode provocar resultados negativos em uma busca, como exemplo, a não recuperação de documentos cujos conceitos se encontram implícitos, por outro lado, a linguagem controlada pode sofrer influência de erro do indexador. Assim, as palavras-chave (pertencentes a linguagem natural) ou os descritores (pertencentes a linguagem controlada), quando atribuídos às teses descrevem o tema, o assunto delas, contribuem nos processos de indexação de documentos físicos ou eletrônicos e são usadas pelas ferramentas de busca com o propósito de recuperação. (BRANDAU; MONTEIRO; BRAILE, 2005; CINTRA et al., 2002; VITAL, 2010; TOMÁS-CASTERÁ, 2009; FERREIRA, 2012). 23 A revisão da literatura permitiu identificar a existência de poucos trabalhos que abordam sobre o uso das palavras-chave como indicadores possíveis de revelar tendências temáticas de produção científica, mas outras abordagens têm sido bastante pertinentes. Miguéis et al. (2013) em seu artigo buscou comparar as palavras-chave dos artigos científicos da área da Ciência Farmacêutica, depositados no repositório da Universidade de Coimbra, com os termos da linguagem documental do Medical Subject Headings (MeSH) e a base de dados MEDLINE. Nesta comparação, verificou-se que o número de palavras-chave citadas pelos autores dos artigos é significativamente mais baixo do que os termos utilizados pela MEDLINE. Tal resultado demonstra a importância da utilização das palavras-chave no processo da indexação por assuntos e alerta aos autores de produções cientificas, enquanto intervenientes ativos no processo de representação e recuperação da informação, o quanto as palavras-chave registradas nos seus artigos, significam para a representação e recuperação da informação, bem como na contribuição para uma maior visibilidade, probabilidade de aumento de citações, e maior impacto da produção científica dos autores. Ferreira (2012) em sua dissertação verificou a possibilidade de visualizar a memória científica da Ciência da Informação brasileira, através das palavras-chave dos trabalhos publicados entre os anos 2003 e 2010 no Encontro Nacional de Pesquisa em Ciência da Informação (ENANCIB). Após as coletas, ela utilizou meios bibliométricos e representações por meio de gráficos, dendogramas e sociogramas para realizar análises. A autora verificou que a forma como as palavras-chave foram representadas nas comunicações, não proporcionou uma compreensão rigorosa de seus conteúdos. Dessa maneira, para atingir o objetivo foi necessário submeter as palavras-chave a uma padronização, a um grau de controle para facilitar a representação. Zanela e Titon (2005) desenvolveram em seu artigo discussões acerca do levantamento realizado por elas sobre dissertações e tese dos PPG em Psicologia, disponíveis na base de dados da CAPES, que tinham as seguintes palavras-chave: criatividade, atividade criadora, processos de criação, estética. Após realizarem análises qualitativas e quantitativas destacaram que a qualidade dos resumos analisados constitui uma limitação para as análises empreendidas e apontaram 24 também a necessidade de haver maior atenção, por parte dos pesquisadores, na elaboração dos resumos e na utilização das palavras-chave. Barra et al. (2006) desenvolveram em seu artigo discussões sobre os resultados de recuperação da informação quando utilizou os descritores em ciência da saúde com palavras-chave no Google, no Google scholar e na base de dados Scielo. Os autores procuraram entender como funcionavam estas ferramentas e como os artigos científicos eram indexados. Logo verificaram que a recuperação por meio de descritores (linguagem controlada) era mais eficiente, pois os artigos científicos da área de saúde são assim indexados, ao contrário, quando utilizaram as palavras-chave (linguagem natural), encontraram grandes dificuldades na recuperação de artigos completos, pois elas não seguiam uma normatização. Tonelo, Lunardelli e Almeida Júnior (2012) buscaram evidenciar as palavras- chave como mediadoras entre a informação registrada e quem dela necessita. Verificou-se que as palavras-chave são representações do conteúdo temático do documento, elaboradas na maioria das vezes por não profissionais especializados. Nesta perspectiva, o estudo buscou evidenciar a estreita relação entre a mediação da informação e a elaboração e/ou indicação de palavras-chave que representem, o mais fidedignamente possível, o conteúdo do documento. Borba, Van de Laan e Chini (2012) destacam a importância das palavras- chave como unidades de representação e de recuperação da informação. Salienta a necessidade de se estabelecer a inter-relação entre linguagem natural e terminologia de um domínio, aperfeiçoando a linguagem documentária. Conclui que um sistema de recuperação da informação, no qual seja representada a informação em consonância com a linguagem dos usuários, possibilitará uma recuperação de informação com maior precisão e pertinência. Godinho (2014) em seu trabalho objetivou analisar a recuperação da informação proporcionada pelo mecanismo de busca do software DSpace e a base de dados contida no Repositório Institucional da Universidade de Rio Grande – FURG. A autora considerou o uso de linguagem natural e controlada e verificou problemas relacionados ao uso de acentos gráficos, a falta de controle de termos sinônimos e a ocorrência de silêncio documental. Concluiu que o uso de linguagens controladas pode favorecer a recuperação das informações mais eficiente, porém não se descarta o uso da linguagem natural. 25 De uma maneira geral, indexar documentos com descritores ou com palavras- chave é uma tarefa racional, em que o sujeito indexador deve estar consciente da sua ação, pois, além dessas linguagens representarem o conteúdo, elas tem um fim essencial, a recuperação da informação, que é a chegada dela á parte mais importante, o usuário. 26 3 PROCEDIMENTOS METODOLÓGICOS Estaseção aborda os detalhes da pesquisa quanto ao percurso metodológico adotado. Contempla detalhes da pesquisa, o universo pesquisado, o processo de coleta e tratamento dos dados, bem como as dificuldades encontradas. Busca-se por questões e respostas convergentes ao âmbito da CI, todavia, outras tantas podem ser reformuladas a respeito do mesmo objeto, e nestas, mais perguntas, mais respostas ou refutações podem surgir, conforme os embasamentos teóricos existentes. Assim, delimitou-se um recorte espacial e temporal, os quais correspondem aos conhecimentos produzidos no Curso de Doutorado do PPGEO da UFPE, materializados nas cinqüenta (50) teses que foram defendidas entre os anos de 2008 e 2014, disponíveis, on line, no RI da citada IFES. O uso de palavras-chave como recurso para representação da memória científica, significa em representar uma atividade social, o fazer científico. Tal representação nada mais é que um modelo da realidade, construído de forma a selecionar os fenômenos de maior relevância, possível de capturar as características essenciais de um domínio de conhecimento (CHORLEY; HAGGETT, 1975; GIL, 2009; MENDONÇA; ALMEIDA, 2012; TRZESNIAK, 1998;). Os procedimentos consistiram numa revisão histórica da formação do PPGEO na UFPE, num levantamento dos aspectos do Repositório Informacional, na coleta das teses, organização, tratamento e uniformização das palavras-chave para geração de tags clouds. 3.1 Caracterizações do Programa de Pós-Graduação em Geografia da UFPE (PPGEO da UFPE) A formação de Doutores em Geografia no Brasil teve iniciativa com os primeiros Programas de Pós-Graduação (PPG), nos moldes que hoje conhecemos, junto à Universidade de São Paulo (USP) em 1971, e à Universidade Federal do Rio de Janeiro (UFRJ) em 1972. O Relatório de Avaliação dos PPG, ano 2005, realizado pela Fundação Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) aponta que o PPGEO da UFPE, iniciado em 1976, foi o terceiro criado no país e o primeiro do Norte e Nordeste, com a instalação do curso de Mestrado. 27 Nos últimos 39 anos, o PPGEO da UFPE tem contribuído para a independência intelectual de seus egressos, grande parte já estabelecida como docentes de universidades federais, estaduais e privadas, institutos federais de educação, órgãos públicos e privados. A criação do Doutorado, em 2004, inaugurou um novo momento na trajetória do programa em que ressaltou o crescimento da capacidade de formação de recursos humanos qualificados, de um lado, e, de outro, a ampliação das competências de pesquisa em geografia física, estudos intraurbanos e em novas temáticas, tais como a geografia ambiental, de serviços e da inovação. Quanto a produção científica, conta-se hoje com aproximadamente, 250 Dissertações e 55 Teses de Doutorado defendidas até o terceiro trimestre do ano de 2015, e vem se destacando na região Nordeste do Brasil pela referência na qualidade das pesquisas em Geografia. O PPGEO da UFPE oferece duas áreas de concentração e seis linhas de pesquisa sincronizadas às inovações teóricas e tecnológicas, conforme o quadro 2. Quadro 2: ÁREA DE CONCENTRAÇÃO E LINHAS DE PESQUISA DO PPGEO DA UFPE Fonte: Disponível em: <http://www.ufpe.br/posgeografia/> Acesso em: 15 nov. 2015. ÁREA DE CONCENTRAÇÃO 1 DINÂMICAS DAS PAISAGENS NATURAIS E ECOSSISTEMAS LINHAS DE PESQUISA ANÁLISE, CONSERVAÇÃO E MONITORAMENTO DE ECOSSISTEMAS DINÂMICA SUPERFICIAL E CLIMÁTICA DAS PAISAGENS NATURAIS, TROPICAIS ÚMIDAS E SEMI-ÚMIDAS ÁREA DE CONCENTRAÇÃO 2 DINÂMICAS REGIONAIS E SÓCIO ESPACIAIS CONTEMPORÂNEAS LINHAS DE PESQUISA DINÂMICAS TERRITORIAIS DO DESENVOLVIMENTO E REGIONALIZAÇÃO PRODUTO E DINÂMICAS DOS ESPAÇOS METROPOLITANOS E DAS CIDADES INTERMEDIÁRIAS ESPAÇO AGRÁRIO, MOVIMENTOS SOCIAIS E POLÍTICAS PÚBLICAS EDUCAÇÃO, CULTURA, POLÍTICA E INOVAÇÃO NA PRODUÇÃO CONTEMPORÂNEA http://www.ufpe.br/posgeografia/ 28 3.2 Características do Repositório Institucional da UFPE. Leite (2009, p. 21) diferencia Biblioteca Digital (BD) de Repositório Institucional apontando que este último apresenta conteúdos científicos ou acadêmicos produzidos na instituição. Caracteriza-se pela interoperabilidade e o software utilizado busca atender demandas da comunicação científica. Ao contrário, a BD não necessariamente precisa atender esses critérios. Assim para esse autor, RI de acesso aberto constitui “[...] um serviço de informação científica – em ambiente digital e interoperável – dedicado ao gerenciamento da produção intelectual de uma instituição [...]” abrangendo, dessa forma, “[...] a reunião, armazenamento, organização, preservação, recuperação e, sobretudo, a ampla disseminação da informação científica produzida na instituição”. Nesse contexto, os repositórios digitais emergiram no contexto das universidades e trazem a ideia de preservação dos objetos digitais, além de promover o acesso livre a conteúdos. Em geral usados para arquivar, disseminar e preservar documentos da literatura científica. (BOSO, 2011; LEITE, 2006; LEITE, 2009; SAYÃO, 2009;). Grande parte da produção da UFPE que em 2013 estava na Base de Dados de Teses e Dissertações da UFPE (BDTD) passou a ser migrada para o RI, em virtude da necessidade de um modelo de gestão de documentos eletrônicos que proporcionasse maior visibilidade à produção intelectual da instituição. O RI da UFPE está inserido no movimento mundial de acesso aberto à produção científica da instituição e está organizado em comunidades que correspondem aos Centros Acadêmicos (CFCH: Centro de Filosofia e Ciências Humanas; CTG: Centro de Tecnologia e Geociências; entre outros), com cerca de treze mil arquivos (Teses, Dissertações, Trabalhos de Conclusão de Curso, Artigos de periódicos e Livros) disponíveis para leitura e download. Com base nas definições da literatura e nas experiências institucionais, podemos definir um produto de informação como Repositório Digital quando ele possuir as seguintes características: Ter uma versão completa da obra, materiais suplementares e cópia da licença; Publicada com padrões tecnológicos aderentes a normas técnicas de preservação digital (como as definições estabelecidas pelo modelo Open Archives e o modelo OAIS); 29 Mantido por uma instituição acadêmica, sociedade científica, organismo governamental, setor privado, ou outra organização estabelecida que pretenda promover o acesso, a distribuição, a interoperabilidade e o arquivamento em longo prazo. Parece, portanto, pertinente enfatizar que as mudanças introduzidas pelo desenvolvimento e implementação de RI no ambiente das universidades tem influenciado nas mudanças do estudo de problemas que constituem questões relevantes para a disseminação da informação, a sua organização e a sua representação. Tais mudanças se inserem também no debate a respeito do sistema e da gestão do conhecimento cientifico, em um diversificado número de disciplinas, entre elas a Gestão da Informação. (LEITE, 2006). Godinho (2014) observa no seu trabalho a existência de alguns repositórios digitais que fazem uso de palavras-chave em linguagem natural para representar o conteúdo de documentos e outros que fazem uso de vocábulos da linguagem controlada. A respeito disso, a autora apresenta alguns trabalhos, que abordam estas questões e afirma que os primeiros, que usam linguagem natural, podem apresentar “[...] limitações nos resultados de buscas ou o silêncio na recuperação dos itens, como por exemplo: se o usuário não inserir termo idêntico à palavra-chave poderá não ter sucesso em sua busca”, diferentemente dos repositórios que fazem uso de vocabulário controlado. A mesma autora ainda acrescenta ter percebido em sua pesquisa que uma das grandes diferenças entre os repositórios, pode estar relacionada aos tipos de softwares utilizadose as possibilidades oferecidas por esses, uma vez que “[...] essas tecnologias devem ser consideradas, pois elas podem interferir na recuperação das informações”. (GODINHO, 2014, p.60). O Repositório Institucional da Universidade Federal de Pernambuco (RI- UFPE) utiliza as palavras-chave designadas pelos autores em linguagem natural para representar os assuntos contidos nos documentos. Esse repositório busca armazenar os itens de forma a preservar a produção intelectual da instituição, e, por permite o acesso a seus documentos, favorece a ampliação da visibilidade dos autores que nele depositam seus trabalhos e, por consequência, da própria UFPE. O software DSpace utilizado por esse repositório tem como finalidade realizar diferentes tipos de busca no RI da UFPE pelo índice alfabético de assunto, título, autor; pela caixa de busca que permite o emprego de operadores booleanos, 30 caractere de truncamento, a caixa de busca localiza valores contidos em quaisquer dos metadados contidos no formato Dublin Core e pode restringir os resultados pelo uso de filtros; pela caixa de busca geral em todo o repositório ou específica por comunidade/subcomunidade /coleções, etc.; e, também, pela busca facetada que permite o descobrimento de outros documentos a partir da visualização de autores e assuntos relacionados com o termo de busca. É neste ambiente virtual (RI da UFPE) que estão armazenadas cerca de 170 dissertações (mais de 50%) e a totalidade das teses defendidas até o terceiro trimestre de 2015 (55 teses). O Curso de Doutorado teve inicio em 2004, e as defesas ocorreram a partir de 2008, num momento em que o RI já era uma realidade para a maioria das IFES (ROSA, 2009). Estes documentos caracterizam-se como fontes seguras e como registros da produção de conhecimento de grande confiabilidade, pois para a construção delas houve um acompanhamento de um orientador e foram submetidas a uma banca de avaliação, a qual constatou a importância das mesmas, no meio acadêmico. (SANTOS et al., 2007). 31 3.3 A Coleta das Teses no RI da UFPE O RI da UFPE caracteriza-se como um Repositório Digital Institucional onde são depositadas obras de caráter acadêmico tais como as teses, documentos que foram utilizados para este TCC. O acesso ao ambiente se dá pelo site www.repositorio.ufpe.br. A busca das teses se sucedeu ao digitar o nome do curso “geografia”, no campo ‘Buscar Dspace’ e com um clique no botão ‘ir’, de acordo com a indicação da seta na figura 1. Figura 1: PÁGINA INICIAL DO RI DA UFPE Fonte: Disponível em: <http:// http://www.repositorio.ufpe.br/> Acesso em 15 nov. 2015. http://www.repositorio.ufpe.br/ http://www.repositorio.ufpe.br/ 32 O sistema recuperou todos os trabalhos acadêmicos do PPGEO divididos em Dissertações e Teses (Figura 2). Figura 2: COLEÇÕES DE ITENS POR COMUNIDADE DO PPGEO DA UFPE Fonte: Disponível em: <http://www.repositorio.ufpe.br/discover> Acesso em 17 nov. 2015. http://www.repositorio.ufpe.br/discover 33 Em seguida, clicou-se no link ‘Teses de Doutorado’. O Sistema apresentou a lista de teses conforme cronologia de defesa. É possível também usar filtros para especificar a pesquisa, tais como: ‘por data do documento’, ‘autores’, ‘títulos e ‘assuntos’. Para o desenvolvimento deste TCC, utilizou-se o filtro ‘por data de documento’ (Figura 3). Figura 3: FILTROS DE BUSCA DO RI DA UFPE Fonte: Disponível em: <http://www.repositorio.ufpe.br/handle/123456789/308> Acesso em 17 nov. 2015. http://www.repositorio.ufpe.br/handle/123456789/308 34 Foi digitado o ano 2007, clicou-se no botão ‘ir’ e o sistema apresentou a lista das teses defendidas no ano posterior ao digitado até a mais recente. É possível também ordenar os documentos por data ascendente ou descendente, bem como a quantidade de documentos para visualizar na página (Figura 4). Figura 4: USO DO FILTRO DE BUSCA POR DATA DO DOCUMENTO Fonte: Disponível em < http://www.repositorio.ufpe.br/handle/123456789/308/browse> Acesso em 17 nov. 2015. http://www.repositorio.ufpe.br/handle/123456789/308/browse 35 Verificou-se que o RI registra a existência de 57 teses armazenadas. No entanto, 2 delas encontram-se duplicadas (Quadro 3), totalizando portanto 55 itens. Para este TCC delimitou-se analisar as Teses defendidas até o final de 2014, cujo universo de documentos constitui-se de 50 itens na coleção. Quadro 3: TESE EM DUPLICIDADE NO RI DA UFPE ANO DE DEFESA/AUTOR URL TÍTULO 2012/ Ailton Feitosa http://www.repositorio.ufpe.br/handle/123456789/10688 Zoneamento de pequenas bacias hidrográficas e caracterização de várzeas na Bacia do Pajeú, Pernambuco 2013/ Alba Lucia da Silva Marinho http://www.repositorio.ufpe.br/handle/123456789/10634 Pontos de cultura em Olinda-PE: territórios de saberes e tessituras para o turismo de base comunitária Fonte: Disponível em: <http://: www.repositorio.ufpe.br> Acesso em: 15 nov. 2015. Quadro 4: TESE ARMAZENADA NO RI COM TÍTULO DIVERGENTE DA OBRA FÍSICA ANO DE DEFESA/AUTOR 2012/ Santiago Andrade Vasconcelos TÍTULO NO RI O uso do território do município de Pedra Lavrada - PB pela mineração: Elementos de inserção como lugar do fazer no contexto atual da globalização TÍTULO NA OBRA Região, Globalização e Meio Técnico-Cientifico-Informacional: Modernizações, Horizontalidades e Verticalidades na Região do Seridó Paraibano e Potiguar na Transição do Século XX e XXI URL http://www.repositorio.ufpe.br/handle/123456789/10904 Fonte: Disponível em: <http://: www.repositorio.ufpe.br> Acesso em: 15 nov. 2015. http://www.repositorio.ufpe.br/handle/123456789/10688 http://www.repositorio.ufpe.br/handle/123456789/10688 http://www.repositorio.ufpe.br/handle/123456789/10688 http://www.repositorio.ufpe.br/handle/123456789/10688 http://www.repositorio.ufpe.br/handle/123456789/10688 http://www.repositorio.ufpe.br/handle/123456789/10688 http://www.repositorio.ufpe.br/handle/123456789/10634 http://www.repositorio.ufpe.br/handle/123456789/10634 http://www.repositorio.ufpe.br/handle/123456789/10634 http://www.repositorio.ufpe.br/handle/123456789/10634 http://www.repositorio.ufpe.br/handle/123456789/10634 http://www.repositorio.ufpe.br/handle/123456789/10634 http://www.repositorio.ufpe.br/ http://www.repositorio.ufpe.br/handle/123456789/10904 http://www.repositorio.ufpe.br/handle/123456789/10904 http://www.repositorio.ufpe.br/handle/123456789/10904 http://www.repositorio.ufpe.br/handle/123456789/10904 http://www.repositorio.ufpe.br/ 36 Verificou-se também que no conjunto das 50 teses, o título de uma delas não corresponde ao título da tese original e dessa maneira sugere-se que os setores responsáveis possam verificar possíveis equívocos. Após as etapas iniciais de acesso ao RI da UFPE até o momento apresentadas, dá-se continuidade com um clique em um dos itens da coleção. O sistema direcionou para uma página que contém metadados descritivos do item selecionado, tais como: título, autor, URL, ano de defesa, resumo, nome eletrônico do arquivo, o seu tamanho e tipo do formato, além de dois links, que são: ‘visualizar/abrir’ e ‘registro completo’ (Figura 5). Figura 5: DESCRIÇÃO FÍSICA E TEMÁTICA DO DOCUMENTO Fonte: Disponível em: < http://www.repositorio.ufpe.br/handle/123456789/6097> Acesso em: 18 nov. 2015. 1 link 2 link http://www.repositorio.ufpe.br/handle/123456789/6097 37 O primeiro link, ‘registro completo’, foi clicado e direcionou para uma página que apresenta mais detalhadamente a descrição física e temática da tese. Desta página coletaram-se as palavras-chave que foramadotadas no RI da UFPE, quando as teses foram armazenadas. (Figura 6). Figura 6: LOCALIZAÇÃO DAS PALAVRAS-CHAVE ATRIBUIDAS AO DOCUMENTO NO RI DA UFPE Fonte: Disponível em: < http://www.repositorio.ufpe.br/handle/123456789/6097?show=full> Acesso em 18 nov. 2015. http://www.repositorio.ufpe.br/handle/123456789/6097?show=full 38 . O segundo link, ‘visualizar/abrir’, foi clicado e teve acesso ao conteúdo completo do documento, formato PDF, e nesse momento coletaram-se as palavras- chave da ficha catalográfica, as quais fazem parte das linguagens controladas (Figura 7). Figura 7: LOCALIZAÇÃO DAS PALAVRAS-CHAVE NA FICHA CATALOGRÁFICA Fonte: Disponível em: <http://www.repositorio.ufpe.br/bitstream/handle/123456789/6097/arquivo3561_1.pdf?sequence=1&is Allowed=y> Acesso em: 18 nov. 2015. http://www.repositorio.ufpe.br/bitstream/handle/123456789/6097/arquivo3561_1.pdf?sequence=1&isAllowed=y http://www.repositorio.ufpe.br/bitstream/handle/123456789/6097/arquivo3561_1.pdf?sequence=1&isAllowed=y 39 Coletaram-se também as palavras-chave citadas nos resumos, as quais foram atribuídas pelos seus autores (Figura 8) e por fim, as teses foram salvas numa base de dados pessoal (Figura 9). Figura 8: LOCALIZAÇÃO DAS PALAVRAS-CHAVE NO RESUMO DA TESE Fonte: Disponível em: <http://www.repositorio.ufpe.br/bitstream/handle/123456789/6097/arquivo3561_1.pdf?sequence=1&is Allowed=y> Acesso em: 18 nov. 2015 Figura 9: TESES ARMAZENADAS EM BASE DE DADOS PESSOAL Fonte: Print screen da pasta elaborada pelo autor contendo as Teses. http://www.repositorio.ufpe.br/bitstream/handle/123456789/6097/arquivo3561_1.pdf?sequence=1&isAllowed=y http://www.repositorio.ufpe.br/bitstream/handle/123456789/6097/arquivo3561_1.pdf?sequence=1&isAllowed=y 40 3.4 A Organização e Representação Visual das Palavras-Chave Na medida em que as 50 teses eram acessadas no RI, e salvas numa base de dados pessoal, as palavras-chave adotadas no repositório, as descritas na ficha catalográfica e as atribuídas pelos autores nos resumo eram coletadas, e organizadas em três diferentes tabelas do software Word, formato txt, a exemplo do Quadro 5. Quadro 5: EXEMPLO DA ORGANIZAÇÃO DAS PALAVRAS-CHAVE PARA GERAÇÃO DE NUVENS DE PALAVRAS Nr Título Ano de Defesa/Autor Palavra-Chave Resumo Palavra-Chave Repositório Palavra-Chave Ficha 01 Interação de comunidades rurais com recursos vegetais: o caso dos remanescentes de floresta estacional do Município de Junqueiro (AL- Brasil) 2008 / Andre Luiz da Silva Santos Comunidade Rural Comunidade Rural Geografia Recurso vegetal Recurso vegetal Geografia ambiental Remanescente vegetal Remanescente vegetal Recurso natural Floresta estacional Floresta estacional Degradação ambiental Fonte: Elaborado pelo autor, 2015. A etapa seguinte consistiu em escolher uma ferramenta que possibilitasse uma visualização das palavras-chave verificadas. Visualizar é “tornar algo visual ou visível, ver uma imagem mental ou figurá-la mentalmente”. (HOUAIS, 2001, p. 2152). Este conceito difere do conceito de visualização, o qual é definido como a “transformação de conceitos abstratos em imagens reais ou mentalmente visíveis”. (HOUAIS, 2001, p. 2153). Nesta pesquisa, o conceito de Visualização de Informações refere-se ao uso de representações visuais, interativas e suportadas por computador, de dados abstratos para ampliar a cognição. (CARD; MACKINLAY; SHNEIDERMAN, 1999). http://www.repositorio.ufpe.br/handle/123456789/6085 http://www.repositorio.ufpe.br/handle/123456789/6085 http://www.repositorio.ufpe.br/handle/123456789/6085 http://www.repositorio.ufpe.br/handle/123456789/6085 http://www.repositorio.ufpe.br/handle/123456789/6085 http://www.repositorio.ufpe.br/handle/123456789/6085 http://www.repositorio.ufpe.br/handle/123456789/6085 http://www.repositorio.ufpe.br/handle/123456789/6085 http://www.repositorio.ufpe.br/handle/123456789/6085 http://www.repositorio.ufpe.br/handle/123456789/6085 41 Ferreira (2012) em sua dissertação recorreu aos sociogramas para visualização das relações entre as palavras-chave dos GTs dos ENANCIBs, bem como os dendogramas para visualização dos níveis de relação de proximidade e de distanciamento entre elas. Santos et al. (2007) fez uso de gráficos gerados pelos softwares ‘Dataview’ e ‘Infotrans’ para obter a visualização das temáticas mais pesquisadas em dissertações de sete Programas de Pós-graduação em Ciência da Informação e no Instituto de Pesquisas Energéticas e Nucleares. Como se pode observar, cada ferramenta de representação visual está mais ou menos adequada de acordo com os propósitos de alguma pesquisa. No caso desta, a ferramenta para visualização que acredit-se ser pertinente é a Nuvem de Palavras (Tags Clouds), pois a mesma pode representar à maior e a menor freqüência dos termos. em que se pretende identificar as tendências temáticas do Curso de Doutorado do PPGEO, a partir das palavras-chave atribuídas às teses A Nuvem de palavras, ou do inglês, Tag Clouds parece ser uma das representações gráfica bastante utilizada quando se trata de mineração de texto (LEMOS, 2013). Portanto, elas são um método heurístico de análise e por si só não vão resolver um problema ou responder a uma questão de pesquisa, mas apontam caminhos para o quê se observar em um texto ou, mais importante ainda, em um grupo de textos. Segundo Nielsen e Loranger (2007, p.258), “a web é um meio direcionado aos usuários, em que estes adotam estratégias de busca de informações para economizar tempo. Eles não tendem a buscar informações de uma maneira linear. Em vez disso, contam com pistas visuais que fornecem uma indicação mais forte [...]” e esse sentido, nuvem de palavras é uma abordagem que cria metadados, cuja técnica aumentou a popularidade com o advento das chamadas ferramentas de bookmarking social, dentre as quais destacam-se o Delicious, Flicker e Technorati, sistemas em expansão acelerada no cenário web atual (web 2.0). A função das nuvens de palavras é representar as variáveis de interesse, no caso deste TCC, as palavras-chave das teses analisadas. Embora permitam a exibição de muito mais itens, de dezenas até centenas, via de regra, em termos conceituais, as nuvens de palavras são similares a histogramas e gráficos de freqüência. Ainda assim, as nuvens de palavras permitem uma compreensão muito mais rápida do contexto associado a um documento. 42 O experimento aqui apresentado tem as teses do Curso de Doutorado do PPGEO da UFPE como documento essencial de onde foram coletadas as palavras- chave atribuídas no resumo, na ficha catalográfica e no RI da UFPE. Nesse sentido, estipularam-se alguns procedimentos, principalmente no sentido de eliminar acentos e termos no plural. Após isso se procedeu a construção de três nuvens, a partir das palavras- chave citadas para constituir-se em material de pré-análise das tendências temáticas. Dessa maneira, foi utilizada uma aplicação web que gera nuvem de palavras estática, denominada de tagcrowd (Figura 10) e acessível pelo site http://tagcrowd.com/. Figura 10: PÁGINA INICIAL DO SITE TAGCROWD Fonte: Disponível em: < http://tagcrowd.com/> Acesso em 5 dez.2015. Basta inserir os termos e solicitar para visualizar clicando no botão ‘visualize’. Imediatamente a imagem é gerada, a qual pode ser exportada. O tamanho da fonte e a cor das palavras correspondem à freqüência com que cada palavra aparece no texto. Esta aplicação web apresenta filtros para personalizar a nuvem de tags. Representar visualmente a freqüência das palavras-chave, por meio das tags clouds, significa identificar a palavra-chave (temática) mais relevante. http://tagcrowd.com/43 4 ANÁLISE DOS RESULTADOS Nesta seção apresentam-se as nuvens de palavras que foram geradas a partir da inserção de todas as palavras-chave, citadas pelos autores, atribuídas no RI da UFPE e atribuídas nas fichas catalográficas, das teses defendidas no mesmo ano, organizadas, como por exemplo, no quadro 6. Quadro 6: PALAVRAS-CHAVE ATRIBUIDAS PELOS AUTORES DAS TESES DEFENDIDAS EM 2008 TOTAL DE TESES DEFENDIDAS EM 2008 ANO DE DEFESA E AUTORES DA TESE TITULO PALAVRAS-CHAVE RESUMO 1 2008 TESE Andre Luiz da Silva Santos Interação de comunidades rurais com recursos vegetais: o caso dos remanescentes de floresta estacional do Município de Junqueiro (AL-Brasil) COMUNIDADE RURAL; RECURSO VEGETAL; REMANESCENTE FLORESTAL; FLORESTA ESTACIONAL; INTERACAO PESSOA PLANTA 2 2008 TESE Maria Betania Moreira Amador A visão sistêmica e sua contribuição ao estudo do espaço pecuário de Venturosa e Pedra no agreste de Pernambuco GEOGRAFIA; ECODINAMICA; AGROECOLOGIA; SISTEMISMO; COMPLEXIDADE; SUSTENTABILIDADE; 3 2008 TESE Sergio Luiz Malta de Azevedo Produção do espaço urbano- regional na área das hidrelétricas do submédio São Francisco PAULO AFONSO; REGIONALIZACAO; ESPACO URBANO-REGIONAL; USINA HIDRELETRICA; SUB-MEDIO SÃO FRANCISCO; Fonte: Elaborado pelo autor, 2015. . Não há a visualização dos três conjuntos de palavras-chave, mas de apenas dois, pois as palavras-chave atribuídas pelos autores nos resumos das teses, e as adotadas no RI da UFPE são praticamente as mesmas. Assim, uma nuvem de palavras que representa as palavras-chave do resumo e do RI da UFPE e outra nuvem das palavras-chave da ficha catalográfica. Durante a inserção das palavras-chave no tagcrowd os termos: ‘paisagem rural’, ‘paisagem urbana’, ‘espaço urbano’, entre outros, foram considerados separados, assim, cada palavra teve sua freqüência contada no intuito de evitar que http://www.repositorio.ufpe.br/handle/123456789/6085 http://www.repositorio.ufpe.br/handle/123456789/6085 http://www.repositorio.ufpe.br/handle/123456789/6085 http://www.repositorio.ufpe.br/handle/123456789/6085 http://www.repositorio.ufpe.br/handle/123456789/6085 http://www.repositorio.ufpe.br/handle/123456789/6085 http://www.repositorio.ufpe.br/handle/123456789/6085 http://www.repositorio.ufpe.br/handle/123456789/6085 http://www.repositorio.ufpe.br/handle/123456789/6085 http://www.repositorio.ufpe.br/handle/123456789/6085 http://www.repositorio.ufpe.br/handle/123456789/6097 http://www.repositorio.ufpe.br/handle/123456789/6097 http://www.repositorio.ufpe.br/handle/123456789/6097 http://www.repositorio.ufpe.br/handle/123456789/6097 http://www.repositorio.ufpe.br/handle/123456789/6097 http://www.repositorio.ufpe.br/handle/123456789/6097 44 termos similares semanticamente, como por exemplo, ‘bacia hidrográfica’ e ‘bacia fluvial’ ficassem ocultos. Eliminaram-se também as stopwords, ou conforme Cunha e Cavalcanti (2008), as “palavras não-significativas”, tais como: ‘do’, ‘de’, ‘da’, ‘e’, usadas, por exemplo, em, ‘análise do espaço’, pelo fato de ser considerada “[...] uma palavra sem valor semântico, que não têm sentido.” (FERREIRA, 2012, p. 50). 45 4.1 Primeira Análise Em 2008, início das primeiras defesas do Curso de Doutorado do PPGEO da UFPE, registrou-se naquele ano, a defesa de três teses. A nuvem de palavras gerada demonstra uma única freqüência para um total de 16 palavras presentes nos resumos e no RI da UFPE, referentes ás teses em questão. (Figura 11). Figura 11: REPRESENTAÇÃO DOS TERMOS NATURAIS DAS TESES DEFENDIDAS EM 2008 Fonte: Print Screen do Site <http://tagcrowd.com/>, 2015. A figura 12 se refere a uma nuvem de palavras gerada das mesmas teses que a anterior, porém trata de uma visualização das palavras-chave da ficha catalográfica. Nesta representação, o termo ‘geografia’ apresentou maior freqüência de repetição, seguido do termo ‘ambiental’. Figura 12: REPRESENTAÇÃO DOS TERMOS DA FICHA CATALOGRÁFICADAS TESES DEFENDIDAS EM 2008 Fonte: Print Screen do Site <http://tagcrowd.com/>, 2015. http://tagcrowd.com/ http://tagcrowd.com/ 46 Em 2009, outras três teses foram defendidas. Verificou-se que naquele ano o termo ‘desenvolvimento’ demonstrou maior relevância no conjunto dos termos atribuídos nos resumos e no RI da UFPE (Figura 13). No contexto dos termos da ficha catalográfica (Figura 14), a palavra ‘geografia’ e ‘globalização’ são relevantes. Figura 13: REPRESENTAÇÃO DOS TERMOS NATURAIS DAS TESES DEFENDIDAS EM 2009 Fonte: Print Screen do Site <http://tagcrowd.com/>, 2015. Figura 14: REPRESENTAÇÃO DOS TERMOS DA FICHA CATALOGRÁFICA DAS TESES DEFENDIDAS EM 2009 Fonte: Print Screen do Site <http://tagcrowd.com/>, 2015. http://tagcrowd.com/ http://tagcrowd.com/ 47 Em 2010, houve a defesa de 6 teses. As palavras-chave observadas na representação apontam para, ‘espacial’, com 3 freqüências, ‘espaço’ e ‘Paraíba’, ambas com 2 freqüências (Figura 15) Figura 15: REPRESENTAÇÃO DOS TERMOS NATURAIS DAS TESES DEFENDIDAS EM 2010 Fonte: Print Screen do Site <http://tagcrowd.com/>, 2015. A representação dos termos da ficha catalográfica das teses de 2010, apontam para ‘geografia’ e ‘espaço’ (Figura 16). Figura 16: - REPRESENTAÇÃO DOS TERMOS DA FICHA CATALOGRÁFICA DAS TESES DEFENDIDAS EM 2010 Fonte: Print Screen do Site <http://tagcrowd.com/>, 2015. http://tagcrowd.com/ http://tagcrowd.com/ 48 Em 2011, houve a defesa de 7 teses. E nelas, os termos observados com maior freqüência na nuvem de palavras são: ‘desenvolvimento’, ‘espaço’, ‘nordeste’ e ‘suape’, cada uma com 2 freqüências (Figura 17). A representação dos termos das fichas catalográfica demonstram maior freqüência para ’geografia’ e ‘pe’, este referente a sigla do Estado de Pernambuco. (Figura 18). Figura 17: REPRESENTAÇÃO DOS TERMOS NATURAIS DAS TESES DEFENDIDAS EM 2011 Fonte: Print Screen do Site <http://tagcrowd.com/>, 2015. Figura 18: REPRESENTAÇÃO DOS TERMOS DA FICHA CATALOGRÁFICA DAS TESES DEFENDIDAS EM 2011 Fonte: Print Screen do Site <http://tagcrowd.com/>, 2015. http://tagcrowd.com/ http://tagcrowd.com/ 49 Em 2012 foi o ano que o Curso de Doutorado teve o maior número de defesas até aquele momento (9 teses), e verificou-se também a coincidência de 4 termos presentes tanto nos resumos e RI da UFPE quanto nas fichas catalográficas de 8 teses, pois 1 não possuía sua ficha. Conforme a representação abaixo (Figura 19), destacaram-se 9 termos cada um com 2 freqüências. Em relação aos termos das fichas catalográficas (Figura 20), verificou-se os termos ‘geografia’ e ‘ambiental’ como os de maior freqüência, 8 e 6 respectivamente. Figura 19: REPRESENTAÇÃO DOS TERMOS NATURAIS DAS TESES DEFENDIDAS EM 2012 Fonte: Print Screen do Site <http://tagcrowd.com/>, 2015. Figura 20: REPRESENTAÇÃO DOS TERMOS DA FICHA CATALOGRÁFICA DAS TESES DEFENDIDAS EM 2012 Fonte: Print Screen do Site <http://tagcrowd.com/>, 2015. http://tagcrowd.com/ http://tagcrowd.com/ 50 Os anos de 2013 e 2014 tiveram quantitativo recorde de defesa, 11 teses em cada um destes anos. Ao observar os termos mais freqüentes nos resumos/RI da UFPE, destacam-se ‘cultura’ e ‘espaço’, com 3 freqüências cada, seguidos de outros 7 que aparecem com 2 freqüências (Figura 21). Figura 21: REPRESENTAÇÃO DOS TERMOS NATURAIS DAS TESES DEFENDIDAS EM 2013 Fonte: Print Screen do Site <http://tagcrowd.com/>, 2015. Quanto aos termos presentes nas fichas catalográficas das teses de 2013, verifica-se em sua representação (Figura 22) o predomínio, mais uma vez, do termo‘geografia’, seguido do termo ‘espaço’. Das 11 teses, 2 não possuíam a ficha catalográfica. Os termos foram retirados de 9 teses. Figura 22: REPRESENTAÇÃO DOS TERMOS DA FICHA CATALOGRÁFICA DAS TESES DEFENDIDAS EM 2013 Fonte: Print Screen do Site <http://tagcrowd.com/>, 2015. http://tagcrowd.com/ http://tagcrowd.com/ 51 Analisando as 11 teses defendidas em 2014 verifica-se que os termos que apareceram com maior freqüência nos resumos e RI da UFPE foram: ‘urbana’, ‘espaço’ e semi-árido’ com 2 freqüências cada. (Figura 23). Figura 23: - REPRESENTAÇÃO DOS TERMOS NATURAIS DAS TESES DEFENDIDAS EM 2015 Fonte: Print Screen do Site <http://tagcrowd.com/>, 2015. Quanto aos termos presentes nas fichas catalográficas das teses de 2014, verifica-se em sua representação (Figura 24) o predomínio, mais uma vez, do termo ‘geografia’, seguido do termo ‘clima’ e ‘climatologia’. Figura 24: REPRESENTAÇÃO DOS TERMOS DA FICHA CATALOGRÁFICA DAS TESES DEFENDIDAS EM 2014 Fonte: Print Screen do Site <http://tagcrowd.com/>, 2015. http://tagcrowd.com/ http://tagcrowd.com/ 52 As nuvens de palavras abaixo resultam da condensação dos termos presentes nos resumos das teses (Figura 25), dos atribuídos a elas e que constam no RI da UFPE (Figura 26) e os termos que foram empregados na ficha catalográfica (Figura 27), citados com maior freqüência ao longo dos anos 2008-2014. Figura 25: NUVEM DE PALAVRAS DAS PALAVRAS-CHAVE DOS RESUMOS DAS TESES. Fonte: Elaborado pelo Autor, 2015. Figura 26: NUVEM DE PALAVRAS DAS PALAVRAS-CHAVE DAS TESES NO RI DA UFPE. Fonte: Elaborado pelo Autor, 2015. Como se pode observar, o Repositório Institucional da Universidade Federal de Pernambuco (RI da UFPE) tem utilizado as palavras-chave designadas pelos autores em linguagem natural para representar os assuntos contidos nos documentos. A respeito disso, Fujita (2009, p.130), acrescenta ao discorrer sobre a abordagem sociocognitiva, a qual visa a: [...] compatibilidade entre a linguagem documentária e a linguagem de busca do usuário e, conseqüentemente, do equilíbrio entre a revocação e a precisão do sistema, apresentamos indicadores como contribuição para o aperfeiçoamento e a adequação do uso de linguagem documentária de áreas científicas especializadas de catálogos coletivos, no contexto sociocognitivo de bibliotecários indexadores e usuários para a representação e recuperação da informação em bibliotecas universitárias, a saber: construção do vocabulário a partir das linguagens de especialidades das áreas científicas e da linguagem de busca do usuário, com vistas à compatibilidade entre a linguagem adotada pelo sistema e a de busca do usuário [...]. Godinho (2014) aponta que as linguagens de indexação não-controladas apresentam como vantagem a simplificação no processo de busca. Nesse sentido, parece ser mais fácil digitar, por exemplo, um termo de assunto em LN numa caixa 53 de busca do que manejar um vocabulário controlado que pode exigir a verificação antecipada se determinado termo existe na base de dados ou catálogo. Outros pesquisadores apontam que sistemas de recuperação da informação baseado em LN compromete o resultado da busca devido as características próprias das línguas naturais, como a polissemia, a homonímia, a sinonímia, as quais interferem no resultado significativo da busca. Dodebei (2002, p.12) acrescenta que “a recuperação da informação em LN deve considerar a digitalização de textos completos e o uso de operadores lingüísticos [...]” para haver acesso direto ao documento. A nuvem de palavras abaixo se diferencia, em grande parte, das duas anteriores. A Figura 27 é a visualização do conjunto das palavras-chave presentes nas fichas catalográficas, as quais são resultados de termos controlados que refletem um assunto, conforme um sistema de classificação bibliográfica. Figura 27: NUVEM DE PALAVRAS DAS PALAVRAS-CHAVE ATRIBUÍDAS NAS FICHAS CATALOGRÁFICAS DAS TESES. Fonte: Elaborada pelo Autor, 2015. A partir do exposto, uma solução parece explicitada por Rowley (2002, p. 171) quando afirma que “[...] várias bases de dados já vêm utilizando os dois tipos de linguagens, ou seja, fazendo uso da LN e empregando termos controlados”. Lancaster (2004) ressalta que os Sistemas de Recuperação de Informação ideais constituem-se de sistemas híbridos que utilizam ambas as linguagens, natural e controlada. Semelhantemente, Dias (2006) aponta como situação ideal a combinação, em Sistema de Recuperação da Informação dos vocabulários controlados com as buscas em linguagem natural. 54 5 CONSIDERAÇÕES FINAIS Esta pesquisa apresentou uma estrutura textual na qual o tema convergiu com a proposta do objetivo: verificar se o uso das palavras-chave de teses é potencial recurso para constituição de um mapa temático da memória científica do PPGEO da UFPE. Tal posicionamento se deu pelo fato de entendermos que as palavras são signos dotados de significado e, portanto, representativos do conteúdo do conhecimento registrado. O recenseamento de trabalhos científicos (total de trabalhos elaborados que tratam de um tema, ou que são publicados num período de tempo, ou escritos por um ou mais autores, ou instituições) e as representações estatísticas destes trabalhos são levantamentos da ciência, cruciais na sociedade atual, pois se relaciona com a produção de bens. (MACIAS-CHAPULA, 1998; SANTOS et al., 2007; KOBASHI; SANTOS, 2008; BUFREM; PRATES, 2005; BRASCHER; CAFÉ, 2008; KLEINUBING, 2010). O RI da UFPE é um importantíssimo meio para comunicar e disseminar a memória científica da instituição, inclusive, as teses do Curso de Doutorado do PPGEO da UFPE. A nuvem de palavras funcionou neste trabalho como ferramenta para visualizar a representatividade das palavras-chave citadas pelos autores, às atribuídas no RI da UFPE e as indicadas na ficha catalográfica das teses. Constatou-se que as palavras-chave atribuídas na ficha catalográfica , diante do seu caráter de linguagem controlada, exercem o papel, exclusivo, de auxiliar nos processos de identificação da área geral de conhecimento e o da localização do documento na biblioteca física. Verificaram-se semelhanças entre as palavras- chave atribuídas às teses no RI da UFPE e as atribuídas pelos autores nos resumos, demonstrando o predomínio de termos da linguagem natural no repositório. Os resultados alcançados nesta pesquisa convergem para o que diversos pesquisadores têm apresentado sobre os aspectos positivos e negativos sobre o uso de uma linguagem natural (LN) ou linguagem controlada (LC) num repositório institucional. Positivamente, apontam para o imediato registro da informação em uma base de dados, sem necessidade de consultar a uma linguagem de controle, assim, temas específicos citados nos documentos podem ser encontrados facilmente. Como aspecto negativo, o processo de busca exige um esforço intelectual maior para identificar os sinônimos, as grafias alternativas, os homônimos, além de favorecer o silêncio no sistema, ou seja, a existência de 55 documentos relevantes na base de dados e que não são recuperados. Dessa maneira, a representação temática da produção científica por meio de palavras- chave, sejam elas as oriundas da LN ou da LC é um recorte do todo, é um panorama de uma realidade que em certa medida algumas partes são excluídas e outras aparecem. Todo tipo de representação é um filtro, um recorte da realidade, a qual nunca abarcará todos os elementos de uma realidade. As nuvens de palavras representam recortes, olhares, ponto de vista de um conhecimento. O que elas fazem é formar um mapa, ou vários mapas indicadores, os quais denotam, através de sua visualização, tendências ou panoramas temáticos estudados. Houve grande dificuldade em encontrartrabalhos científicos ou orientações confiáveis que tratam da importância da nuvem de palavras enquanto recurso representativo, denotando a necessidade de ampliar pesquisas sobre ou com o recurso. Dentro de um universo aproximado de 238 palavras-chave, os termos que demonstraram maior relevância, no âmbito das palavras-chave mais citadas nas fichas catalográfica, foram os termos: a) ‘geografia’, b) ‘espaço’, c) ‘urbano’. O primeiro termo, presente em quase todas as fichas catalográficas parece assumir a função exclusiva de indicar o conhecimento geral que a tese faz parte, de acordo com a Classificação bibliográfica adotada, além disso, possibilita a atribuição de um código para localização do item no acervo físico. O segundo termo ‘espaço’, é objeto de estudo para a Ciência Geográfica, assim como é a informação para CI. No entanto é um termo muito amplo, carecendo de um entendimento específico sobre qual tipo de análise se faz sobre e nesse espaço. O termo ‘urbano’ pode ser um indicador da temática em que o Doutorado do PPGEO da UFPE vem se especializando nos últimos anos, ou seja, a cidade parece ser um dos principais recortes espacial de análise. No contexto das palavras-chave citadas pelos autores e as atribuídas no RI da UFPE, totalizaram aproximadamente 240 palavras. Destas, ‘espaço’ e ‘desenvolvimento’ demonstraram ser as que apareceram com maior freqüência. A primeira, anteriormente comentada, a segunda tem conceito que se aproxima do processo dinâmico de melhoria, de mudança dos aspectos qualitativos de vida de uma sociedade. Neste trabalho, pode-se apontar que as palavras-chave sinalizam algumas faces temáticas do Curso de Doutorado que sem dúvida mantém relação com o 56 espaço geográfico em sua base discursiva. No entanto, este estudo é limitado, uma vez que, outros pontos não foram evidenciados e isso demonstra que a representação aqui visualizada não aponta uma conclusão ou verdade irrefutável, mas que se torna necessário aprofundar a metodologia adotada e uma escolha mais coerente das palavras-chave. É importante frisar que raramente um pesquisador atribui palavras-chave às suas produções de acordo com uma convenção requerida ou tem a intenção de que haja a recuperação informacional, e na maioria das vezes não sabe que sua ação representará a memória científica da sua área de estudo. Dessa maneira sugerimos ser importante que os autores e orientadores nos Programas de pós- graduação possam ter um olhar mais atencioso no momento da escolha das palavras-chave que realmente irá representar a produção científica que desenvolvem, uma vez que elas parecem se revelar útil para a indexação e vital tanto para representação temática como para a recuperação de documentos em mecanismos de pesquisa, em especial no RI da UFPE. Verificou-se também que a nuvem de palavras atendeu aos objetivos da pesquisa, mas assim como outras ferramentas, esta apresentou limitações para que fosse possível aprofundar análises e alcançar conclusões mais rebuscadas. Portanto, limitou as possibilidades de apontar com profundidade, um panorama da(s) temática(s) em que o Curso de Doutorado do PPGEO tem se especializado, provavelmente devido ao uso de uma única ferramenta para análise das palavras- chave. Assim, parece ser oportuno diversificar ferramentas nos procedimentos metodológicos para proceder a comparações, relações entre as palavras-chave periféricas e as palavras-chave principais. Sugere-se que outros pesquisadores possam verificar a relação entre as palavras-chave e as linhas de pesquisa do Programa de Pós-graduação e quem sabe atrelá-los aos campos ou subárea de domínio geográfico como por exemplo: Geografia humana, Geografia econômica, Biogeografia, Climatologia, Hidrografia, Geografia histórica. Os objetivos foram alcançados, as etapas foram cumpridas, análises, inferências e conclusões foram feitas. Espera-se que esta pesquisa sirva como modelo, ou fonte para estudos futuros. 57 REFERÊNCIAS ALVARENGA, L. Organização da informação nas bibliotecas digitais. In: NAVES, M. M. L.; KURAMOTO, H. (Org.). Organização da informação: princípios e tendências. Brasília, DF: Briquet de Lemos/Livros, 2006. p.76-98. ALVES, J. C. Organização e representação da informação na biblioteca digital de teses e dissertações da Universidade do Estado de Santa Catarina - UDESC: uma análise focada em metadados sob a luz do padrão MTB-BR. Dissertação de Mestrado. Florianópolis, SC, 2009. Disponível em: <http://pgcin.paginas.ufsc.br/files/2010/10/ALVES-Jaqueline-Costa.pdf> Acesso em: 30. Set.2015. ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS - ABNT. NBR 6022. Informação e documentação: artigo em publicação periódica impressa: apresentação. Rio de Janeiro, 2003. BARRA, P. S. et al. Pesquisa na literatura cientifica usando descritores em ciências da saúde (DECS) versus palavra-chave no Google, Scholar Google e Scielo. In: Anais do X Congresso Brasileiro de Informática em Saúde, v. 1, p. 1373- 1378; 2006, Florianópolis, SC. Disponível em: < http://www.sbis.org.br/cbis/arquivos/343.pdf> Acesso em: 15 abr. 2015. BARRETO, A. de A. Uma história da Ciência da Informação. In: TOUTAIN, L. M. B. B. (Org.). Para entender a Ciência da Informação. Salvador: EDUFBA, 2007. p. 13-34. Disponível em: <https://repositorio.ufba.br/ri/bitstream/ufba/145/1/Para%20entender%20a%20cienci a%20da%20informacao.pdf> Acesso em: 28 set.2015. BETTENCOURT, A. M. A representação da informação na Biblioteca Nacional: do documento tradicional ao digital. Rio de Janeiro: Fundação Biblioteca Nacional, 2014. BORBA, D. dos S.; VAN DER LAAN, R. H.; CHINI, B. R. Palavras-chave: convergências e diferenciações entre a linguagem natural e a terminologia. Perspectivas em Ciência da Informação, v.17, n.2, p.26-36, abr./jun. 2012. Disponível em: <http://www.scielo.br/pdf/pci/v17n2/a03v17n2.pdf> Acesso em 15 nov. 2015. BORKO, H. Information Science – what is it. American Documentation. V.19, n.1, 1968, p.3-5. Disponível em: <https://www.marilia.unesp.br/Home/Instituicao/Docentes/EdbertoFerneda/k---artigo- 01.pdf> Acesso em: 15 nov. 2015. http://pgcin.paginas.ufsc.br/files/2010/10/ALVES-Jaqueline-Costa.pdf http://www.sbis.org.br/cbis/arquivos/343.pdf https://repositorio.ufba.br/ri/bitstream/ufba/145/1/Para%20entender%20a%20ciencia%20da%20informacao.pdf https://repositorio.ufba.br/ri/bitstream/ufba/145/1/Para%20entender%20a%20ciencia%20da%20informacao.pdf http://www.scielo.br/pdf/pci/v17n2/a03v17n2.pdf https://www.marilia.unesp.br/Home/Instituicao/Docentes/EdbertoFerneda/k---artigo-01.pdf https://www.marilia.unesp.br/Home/Instituicao/Docentes/EdbertoFerneda/k---artigo-01.pdf 58 BOSO, A. K. Repositórios de instituições federais de ensino superior e suas políticas: análise sob o aspecto das fontes informacionais. (2011). 150 f. dissertação (Mestre em Ciência da Informação) - Departamento de Ciência da Informação, Universidade Federal de Santa Catarina, Florianópolis, 2011. Disponivel em: <http://pgcin.paginas.ufsc.br/files/2010/10/BOSO-Augiza-Karla.pdf> Acesso em 02 set.2015. BRANDAU, R.; MONTEIRO, R.; BRAILE, D. M. Importância do uso correto dos descritores nos artigos científicos. Rev Bras Cir Cardiovasc, São José do Rio Preto, v. 20, n. 1, Mar. 2005. Disponível em: <http://www.scielo.br/pdf/rbccv/v20n1/v20n1a04.pdf>. Acesso em: 07 jul. 2011. BRASCHER, M.; CAFÉ, L. Organização da informação e bibliometria. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, Florianópolis, n. esp, p. 54-75, jan./jun. 2008. Disponível em: <http://www.periodicos.ufsc.br/index.php/eb/article/view/1334/1032> Acesso em: 12 abr. 2015. BUFREM, L.; PRATES, Y. O saber científico registrado e as práticas de mensuração da informação. Ci. Inf., Brasília, v.34, n. 2, p. 9-25, Aug. 2005. Disponível em: <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S010019652005000200002&lng=en&nrm=iso> Acesso em: 15 abr. 2015. BUCKLAND, M. Information as thing. Journal of the American Society of Information. Science v.42, n. 5, p. 351-360, jun.1991. Tradução Livre de Luciane Artêncio. Disponível em: <http://www.uff.br/ppgci/editais/bucklandcomocoisa.pdf> Acesso em 31 out. 2015. CARD, S. K; MACKINLAY, J. D; SHNEIDERMAN, B. Readings in Information Visualization: Using Vision to Think. Morgan Kaufmann Series in Interactive Technologies. Morgan Kaufmann Publishers Inc., 1999. Disponível em: <http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_003- 04.pdf> Acesso em: 20 nov. 2015 CAPURRO, R.; HJORLAND, B. O conceito de informação. Perspectivas em Ciência da Informação, v. 12, n. 1, p. 148-207, jan/abr. 2007. Disponível em: <http://bogliolo.eci.ufmg.br/downloads/CAPURRO.pdf> Acesso em: 01 out. 2015. CASTELLS, M. A sociedade em rede. 10. ed. totalmente rev. e ampl. São Paulo: Paz e Terra, 2000. 698 p. (A era da informação: economia, sociedade e cultura; v.1). CHORLEY, R.; HAGGETT, P. Modelos, paradigmas e a nova geografia. In: CHORLEY, R; HAGGETT, P. Modelos sócios-econômicos em geografia. Rio de Janeiro: Livros Técnicos e Científicos/USP, p.1-22, 1975. CINTRA, A. M. M.; et al. Para entender as linguagens documentárias. São Paulo: Polis, 2002. http://pgcin.paginas.ufsc.br/files/2010/10/BOSO-Augiza-Karla.pdf http://www.scielo.br/pdf/rbccv/v20n1/v20n1a04.pdf http://www.periodicos.ufsc.br/index.php/eb/article/view/1334/1032 http://www.scielo.br/scielo.php?script=sci_arttext&pid=S010019652005000200002&lng=en&nrm=iso http://www.scielo.br/scielo.php?script=sci_arttext&pid=S010019652005000200002&lng=en&nrm=iso http://www.uff.br/ppgci/editais/bucklandcomocoisa.pdf http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_003-04.pdf http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_003-04.pdf http://bogliolo.eci.ufmg.br/downloads/CAPURRO.pdf 59 CUNHA, M. B.; CAVALCANTI, C. R. Dicionário de biblioteconomia e arquivologia. Brasília: Briquet de Lemos / Livros, 2008. DAHLBERG, I. Teoria do Conceito. Tradução para português do Professor Astério Tavares Campos do Departamento de Biblioteconomia da Universidade de Brasília. Aula ministrada por ocasião do 8. Congresso Brasileiro de Biblioteconomia e Documentação. Brasília, 22-25 de Julho de 1975. C. Inf. Rio de Janeiro, 7 (2): 101- 107, 1978. Disponível em: <http://revista.ibict.br/index.php/ciinf/article/download/1680/1286> Acesso em 10 nov. 2015. DIAS, E. W. Organização do conhecimento no contexto de bibliotecas tradicionais e digitais. In: NAVES, M. M. L.; KURAMOTO, H. (Org.). Organização da informação: princípios e tendências. Brasília, DF: Briquet de Lemos/Livros, 2006. p.62-75. DODEBEI, V. L. D. Tesauro: linguagem de representação da memória documentária. Rio de Janeiro: Intertexto, 2002. 119p. ECO, U. Como se faz uma tese. Tradução Gilson Cesar Cardoso de Souza. São Paulo: Perspectiva, 2010. FERREIRA, M. da S. A representação da memória científica da Ciência da Informação brasileira: um estudo com as palavras-chave do ENANCIB. Recife, 2012. 179 p.: il. Orientador: Fábio Mascarenhas e Silva. Dissertação (Mestrado) – Universidade Federal de Pernambuco, CAC. Ciência da Informação, 2012. FUJITA, M. S. L. A Representação documentária no processo de indexação com o modelo de leitura documentária para textos científicos e livros: uma abordagem cognitiva com protocolo verbal. PontodeAcesso, Salvador, V.7, n.1,p. 42- 66, abr 2013 Disponível em: <http://www.portalseer.ufba.br/index.php/revistaici/article/view/8135/5807> Acesso em: 16 nov. 2015. FUJITA, M. S. L. et al. As diferentes perspectivas teóricas e metodológicas sobre indexação e catalogação de assuntos. In: A indexação de livros: a percepção de catalogadores e usuários de bibliotecas universitárias. Um estudo de observação do contexto sociocognitivo com protocolos verbais. __________ (org.). São Paulo : Cultura Acadêmica, 2009. p.20-42. FUNDAÇÃO COORDENAÇÃO DE APERFEIÇOAMENTO DE PESSOAL DE NÍVEL SUPERIOR - CAPES. Relatório de avaliação trienal de cursos de pós- graduação. Área: Geografia. 2010-2012. Disponível em: <https://www.capes.gov.br/images/stories/download/avaliacao/DocArea04_06_Geog rafia.pdf> Acesso em: 23 jun.2015. GIL, A. C. Como elaborar projetos de pesquisa. 4. ed. São Paulo: Atlas, 2009. http://revista.ibict.br/index.php/ciinf/article/download/1680/1286 http://www.portalseer.ufba.br/index.php/revistaici/article/view/8135/5807 https://www.capes.gov.br/images/stories/download/avaliacao/DocArea04_06_Geografia.pdf https://www.capes.gov.br/images/stories/download/avaliacao/DocArea04_06_Geografia.pdf 60 GODINHO, N. B. Avaliação da recuperação da informação no Repositório Institucional da Universidade Federal do Rio Grande - FURG: discussão sobre linguagem natural e controlada com ênfase na área de Biblioteconomia. Rio Grande, 2014. 243 p.: Il. Orientador: Prof. Rodrigo Aquino de Carvalho. TCC (Graduação em Biblioteconomia) – Instituto de Ciências Humanas e da Informação - ICHI, Universidade Federal do Rio Grande – FURG, Rio Grande, 2014. Disponível em: <http://bdtccs.furg.br/handle/1/65> Acesso em 29 set. 2015. GOMES, L. F. A. Nuvens de tags no twitter: estudo e implementação. UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO Disponível em: <http://www.cin.ufpe.br/~tg/2011-1/lfag.pdf> Acesso em: 20 nov. 2015. GONÇALVES, A. L. Uso de resumos e palavras-chave em Ciências Sociais: uma avaliação. Ci. Inf., Florianópolis, vol.13, n. 26, 2º sem.2008. Disponível em: <http://www.redalyc.org/articulo.oa?id=14712794006> Acesso em: 03 out.2015. GUEDES, R. DE M.; SOUZA, R. R. Navegando entre nuvens de etiquetas: uma proposta de utilização da tag cloud em catálogos eletrônicos de bibliotecas. PontodeAcesso, Salvador, v. 2, n. 3, p. 2-13, dez. 2008. <http://www.portalseer.ufba.br/index.php/revistaici/article/viewFile/3186/2334> Acesso em: 08 nov. 2015 GUEDES, V. L. S., BORSCHIVER, S. Bibliometria: Uma Ferramenta Estatística para a Gestão da Informação e do Conhecimento, em Sistemas de Informação, de Comunicação e de Avaliação Científica e Tecnológica. Disponível em: <http://www.feg.unesp.br/~fmarins/seminarios/Material%20de%20Leitura/Bibliometri a/Artigo%20Bibliometria%20%20Ferramenta%20estat%EDstica%20VaniaLSGuedes .pdf.> Acesso em: 15 abr. 2015. HOUAISS, A. Palavra-chave. In: ______. Dicionário Houaiss da língua portuguesa. Rio de Janeiro: Objetiva, 2001. HUDON, M. The world through words. The Indexer. v.28, n. 4, dec. 2010, p. 146- 150(5). Disponível em: <http://www.ingentaconnect.com/content/index/tiji/2010/00000028/00000004/art0000 2> Acesso em: 20. jun.2015. KLEINUBING, L. da S. Análise bibliométrica da produção científica em gestão da informação na base de dados lisa. Revista Digital de Biblioteconomia & Ciência da Informação v.8, n.1, 2010. Disponível em: <http://www.brapci.ufpr.br/documento.php?dd0=0000009045&dd1=839ac>. Acesso em 02 Mai. 2015. KOBASHI, N; SANTOS, R. N. M. dos. Arqueologia do trabalho imaterial: uma aplicação bibliométrica à análise de dissertações e teses Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianópolis, n. esp., 1º sem. 2008. Disponível em: <http://www.periodicos.ufsc.br/index.php/eb/article/view/1130/868>. Acesso em: 02 mai. 2015. http://bdtccs.furg.br/handle/1/65 http://www.cin.ufpe.br/~tg/2011-1/lfag.pdf http://www.redalyc.org/articulo.oa?id=14712794006 http://www.portalseer.ufba.br/index.php/revistaici/article/viewFile/3186/2334 http://www.feg.unesp.br/~fmarins/seminarios/Material%20de%20Leitura/Bibliometria/Artigo%20Bibliometria%20%20Ferramenta%20estat%EDstica%20VaniaLSGuedes.pdf http://www.feg.unesp.br/~fmarins/seminarios/Material%20de%20Leitura/Bibliometria/Artigo%20Bibliometria%20%20Ferramenta%20estat%EDstica%20VaniaLSGuedes.pdf http://www.feg.unesp.br/~fmarins/seminarios/Material%20de%20Leitura/Bibliometria/Artigo%20Bibliometria%20%20Ferramenta%20estat%EDstica%20VaniaLSGuedes.pdfhttp://www.ingentaconnect.com/content/index/tiji/2010/00000028/00000004/art00002 http://www.ingentaconnect.com/content/index/tiji/2010/00000028/00000004/art00002 http://www.brapci.ufpr.br/documento.php?dd0=0000009045&dd1=839ac http://www.periodicos.ufsc.br/index.php/eb/article/view/1130/868 61 KONDO, E. K. Desenvolvendo indicadores estratégicos em ciência e tecnologia: as principais questões. Ciência da Informação, Brasília, DF, v. 27, n. 2, p. 128-133, maio/ago 1998. Disponível em: < http://www.scielo.br/pdf/ci/v27n2/kondo> Acesso em: 26 abr. 2015. LAKATOS, E. M.; MARCONI, M. de A. Fundamentos de metodologia científica. 4. ed. São Paulo: Atlas, 2001. LANCASTER, F. W. Indexação e resumos: teoria e prática. 2. ed. Brasília, DF: Briquet de Lemos/Livros, 2004. LE COADIC, Y. F. A ciência da informação. Brasília, DF: Briquet de Lemos/Livros, 1996. LEITE, F. C. L. Repositórios institucionais como ferramentas de gestão do conhecimento científico no ambiente acadêmico. Perspect. ciênc. inf., Belo Horizonte, v.11 n.2, p. 206 -219, mai./ago. 2006. http://www.scielo.br/pdf/pci/v11n2/v11n2a05.pdf> Acesso em 30. Ago. 2015. LEITE, F. C. L. Como gerenciar e ampliar a visibilidade da informação científica brasileira: repositórios institucionais de acesso aberto. Brasília: Ibict, 2009. Disponível em: <http://livroaberto.ibict.br/handle/1/775> Acesso em: 20 jul. 2015. LEMOS, L. M. P. Nuvem de tags como ferramenta de análise de conteúdo: uma experiência com as cenas estendidas da telenovela Passione na internet. In: INTERCOM - XXXVI Congresso Brasileiro de Ciências da Comunicação. De 4 a 7 de setembro de 2013. Manaus-Am. Disponível em <http://www.intercom.org.br/papers/nacionais/2013/resumos/R8-0828-1.pdf>. Acesso em: 23 nov.2015 LENZI, L. A. F.; BRAMBILA, E. Z. Ciência da informação, ciência e revolução científica: breve histórico e reflexões. Inf.Inf., Londrina, v. 11, n. 1, jan./jun. 2006. Disponivel em: <http://www.brapci.ufpr.br/journal_edicao_artigos.php?dd0=16&dd1=2006&dd2=jan./ jun.%202006&dd3=v.%2011&dd4=n.%201> Acesso em: 15 out. 2015. LOPES, J. O fazer do trabalho científico em Ciências Sociais Aplicadas. Recife: Ed. Universitária da UFPE, 2006. MACIAS-CHAPULA, C. A. O papel da informetria e da cienciometria e sua perspectiva nacional e internacional. Ciência da informação, v. 27, n. 2, p. 134- 140, 1998. Disponível em: http://www.scielo.br/scielo.php?pid=S0100- 19651998000200005&script=sci_abstract&tlng=pt > Acesso em: 30 abr. 2015. MARION, J. C.; DIAS, R.; TRALDI, M. C. Monografia para os cursos de administração, contabilidade e economia. São Paulo: Atlas, 2002. MENDONÇA, F. Temas, tendências e desafios da geografia na pós-graduação brasileira. Disponível em: < http://www.anpege.org.br/downloads/revista2/temas.pdf> Acesso em: 20 jun. 2015. http://www.scielo.br/pdf/ci/v27n2/kondo http://www.scielo.br/pdf/pci/v11n2/v11n2a05.pdf http://livroaberto.ibict.br/handle/1/775 http://www.intercom.org.br/papers/nacionais/2013/resumos/R8-0828-1.pdf http://www.brapci.ufpr.br/journal_edicao_artigos.php?dd0=16&dd1=2006&dd2=jan./jun.%202006&dd3=v.%2011&dd4=n.%201 http://www.brapci.ufpr.br/journal_edicao_artigos.php?dd0=16&dd1=2006&dd2=jan./jun.%202006&dd3=v.%2011&dd4=n.%201 http://www.scielo.br/scielo.php?pid=S0100-19651998000200005&script=sci_abstract&tlng=pt http://www.scielo.br/scielo.php?pid=S0100-19651998000200005&script=sci_abstract&tlng=pt http://www.anpege.org.br/downloads/revista2/temas.pdf 62 MENDONÇA, F. M.; ALMEIDA, M. B. Modelos e teorias para representação: uma teoria ontológica sobre o sangue humano. In: XII Encontro Nacional de Pesquisa em Ciência da Informação – XIII ENANCIB. 2012, Anais... 28 a 31 de outubro. Rio de Janeiro, RJ. Disponível em: <http://mba.eci.ufmg.br/downloads/ModTeoEnancib2012_v8_MBA_web.pdf> Acesso em: 15 nov. 2015 MIGUÉIS, A. et al. A importância das palavras-chave dos artigos científicos da área das Ciências Farmacêuticas, depositados no Estudo Geral: estudo comparativo com os termos atribuídos na MEDLINE. InCID: Revista de Ciência da Informação e Documentação, Brasil, v. 4, n. 2, p. 112-125, dez. 2013. ISSN 2178- 2075. Disponível em: <http://www.revistas.usp.br/incid/article/view/69284> Acesso em: 28 abr. 2015. MIRANDA, A. L. C. Ciencia da Informação: metodologia de uma área em expansão. Brasília: Thesaurus, 2003. MOREIRA, V. L.; ROMÃO, L. M. S. O funcionamento discursivo das nuvens de tags na rede eletrônica: sentidos sobre Capitolina. DataGramaZero - Revista de Ciência da Informação - v.10 n.6 dez09. Disponível em: <http://www.dgz.org.br/dez09/Art_02.htm> Acesso em: 20 nov. 2015 MUGNAINI, R.; JANNUZZI, P. M.; QUONIAM, L.. Indicadores bibliométricos da produção científica brasileira: uma análise a partir da base Pascal. Ciência da Informação, Brasília, v.33, n. 2, p. 123-131, maio/ago. 2004. Disponível em: <http://www.scielo.br/pdf/ci/v33n2/a13v33n2.pdf> Acesso em: 30 abr. 2015. NOVELLINO, M. S. F. Instrumentos e metodologias de representação da informação. Informação & Informação, Londrina, v.1, n.2, p. 37-45, jul./dez. 1996. Disponível em: <http://www.brapci.inf.br/_repositorio/2010/05/pdf_0e3cc20139_0010458.pdf> Acesso em: 10 out.2015. NIELSEN, J; LORANGER, H. Usabilidade na web: Projetando websites com qualidade. São Paulo: Campus, 2007. ROBREDO, J. Filosofia da ciência da informação ou Ciência da informação e filosofia?. In: TOUTAIN, L. M. B. B. (Org.) Para entender a Ciência da Informação. Salvador: EDUFBA, 2007. p. 35-73. Disponível em: <https://repositorio.ufba.br/ri/bitstream/ufba/145/1/Para%20entender%20a%20cienci a%20da%20informacao.pdf> Acesso em: 28 set.2015. ROBREDO, J. Da ciência da informação revisitada: aos sistemas humanos de informação. Brasilia: Thesaurus; SSRR Informações, 2003. http://mba.eci.ufmg.br/downloads/ModTeoEnancib2012_v8_MBA_web.pdf http://www.revistas.usp.br/incid/article/view/69284 http://www.dgz.org.br/dez09/Art_02.htm http://www.scielo.br/pdf/ci/v33n2/a13v33n2.pdf http://www.brapci.inf.br/_repositorio/2010/05/pdf_0e3cc20139_0010458.pdf https://repositorio.ufba.br/ri/bitstream/ufba/145/1/Para%20entender%20a%20ciencia%20da%20informacao.pdf https://repositorio.ufba.br/ri/bitstream/ufba/145/1/Para%20entender%20a%20ciencia%20da%20informacao.pdf 63 ROSA, F. G. Implantação do repositório institucional da Universidade Federal da Bahia: uma política de acesso à produção científica. In: SAYÃO, L et al. (Org.). Implantação e gestão de repositórios institucionais: políticas, memória, livre acesso e preservação. Salvador : EDUFBA, 2009. p. 231-248. Disponível em: <https://repositorio.ufba.br/ri/bitstream/ufba/473/3/implantacao_repositorio_web.pdf>. Acesso em: 09 jul. 2015. ROWLEY, J. A biblioteca eletrônica. Brasília: Briquet de Lemos/Livros, 2002. SANTAELLA, L. A Teoria geral dos signos: como as linguagens significam as coisas. São Paulo: Pioneira, 2001. SANTOS, C. M. dos. Tradições e contradições da pós-graduação no Brasil. Educ. Soc., Campinas, vol. 24, n. 83, p. 627-641, agosto 2003. Disponível em: < http://www.scielo.br/pdf/es/v24n83/a16v2483.pdf> Acesso em 18 jun. 2015. SANTOS, M. Por uma Geografia Nova. São Paulo: Hucitec, Edusp, 1978. SANTOS, M. A natureza do espaço:espaço e tempo, razão e emoção. 3.ed. São Paulo: Hucitec, 2000. SANTOS, R. N. M. dos et al. Análise cienciométrica de produção científica por meio de dissertações e teses: uma experiência brasileira. In: CONGRESSO IBEROAMERICANO DE INDICADORES DE CIÊNCIA E TECNOLOGIA, 7., 2007, São Paulo. Anais... São Paulo, 2007. Disponível em: <http://www.ipen.br/biblioteca/2007/eventos/14382.pdf> Acesso em: 10 abr. 2015 SANTOS, R. N. M. dos; KOBASHI, N. Y. Bibliometria, cientometria, infometria:conceitos e aplicações. Ciência da Informação, Brasília, v.2, n.1, p.155- 172, jan/dez. 2009. Disponível em: <http://inseer.ibict.br/ancib/index.php/tpbci/article/viewArticle/21> Acesso em: 08 abr. 2015. SAYÃO, L. etal. Implantação e Gestão de Repositórios Institucionais: políticas, memória, livre acesso e preservação. EDUFBA, 2009. 365 p. SILVA, F. M. e. Organização da informação em sistemas eletrônicos abertos de Informação Científica & Tecnológica: Análise da Plataforma Lattes. 2007. Tese (Doutorado em Cultura e Informação) - Escola de Comunicações e Artes, Universidade de São Paulo, São Paulo, 2007, Disponível em: <http://www.teses.usp.br/teses/disponiveis/27/27151/tde17032008-095556/> Acesso em: 26 abr. 2015. SILVA, F. M.; SMIT, J. W. Sistemas Nacionais de Informação Científica e Tecnológica: um breve histórico. In: OLIVEIRA, M.C. G. et al (Org.). Construção, Práticas e Identidades da Ciência da Informação. Recife: NECTAR, 2008. p.57-77. https://repositorio.ufba.br/ri/bitstream/ufba/473/3/implantacao_repositorio_web.pdf http://www.scielo.br/pdf/es/v24n83/a16v2483.pdf http://www.ipen.br/biblioteca/2007/eventos/14382.pdf http://inseer.ibict.br/ancib/index.php/tpbci/article/viewArticle/21 http://www.teses.usp.br/teses/disponiveis/27/27151/tde17032008-095556/ 64 SOUZA, R. F. Organização do conhecimento. In: TOUTAIN, L.M. B. B. (Org.). Para entender a Ciência da Informação. Salvador: EDUFBA, 2007. p. 103-123. Disponível em: <https://repositorio.ufba.br/ri/bitstream/ufba/145/1/Para%20entender%20a%20cienci a%20da%20informacao.pdf> Acesso em: 28 set.2015. THOMAZ, E. L.; GOMES, M. de F. V. B. Considerações sobre a produção e tendência da geografia paranaense no xi simpósio brasileiro de geografia física aplicada. Geografia - v. 15, n. 1, jan./jun. 2006 – Universidade Estadual de Londrina, Departamento de Geociências – p.135-144. <http://www.uel.br/revistas/uel/index.php/geografia/article/viewFile/6658/6007> Acesso em: 26 jun. 2015 TOMAS-CASTERÁ, V. et al . Descriptores versus Palabras Clave sobre nutrición: aportación a la correcta indización. An Venez Nutr, Caracas, v. 22, n. 2, dic. 2009 . Disponível em: <http://www.scielo.org.ve/scielo.php?script=sci_arttext&pid=S079807522009000200 006&lng=es&nrm=iso > Acesso em: 25 abr. 2015. TONELO, I. M. S.; LUNARDELLI, R. A.; ALMEIDA JÚNIOR, O. F. De. Palavras- chave: possibilidades de mediação da informação. PontodeAcesso, Salvador, V.6, n.2, p. 21-34, ago 2012. Disponível em: <http://www.portalseer.ufba.br/index.php/revistaici/article/view/4524/4552> Acesso em: 02 nov. 2015. TRZESNIAK, P. Indicadores quantitativos: reflexões que antecedem seu estabelecimento. Ci. Inf., Brasília, v. 27, n. 2, p. 159-164, maio/ago. 1998. Disponível em: <http://www.scielo.br/pdf/ci/v27n2/trzesniak.pdf> Acesso em: 15 nov. 2015 VALENTIM, M. L. P. Análise de conteúdo. In: Métodos qualitativos de pesquisa em Ciência da Informação. VALENTIM, Marta Ligia Pomim (org) – São Paulo: Polis, 2005. (p.119-134) VELHO, L. Formação de doutores no país e no exterior: estratégias alternativas ou complementares? Revista de Ciências Sociais, Rio de Janeiro, v.44, n.3, p.607- 631, 2001. Disponivel em: <http://dx.doi.org/10.1590/S0011-52582001000300005> Acesso em: 29 mai. 2015. VITAL, L. P. Taxonomia como ferramenta para a representação do conhecimento em portais corporativos. Recife: Ed. Universitária da UFPE, 2010. ZANELLA, A.V; TITON, A. P. Análise da produção científica sobre criatividade em programas brasileiros de pós-graduação em psicologia (1994 - 2001). Psicologia em Estudo, vol. 10, núm. 2, agosto, 2005, p.305-316. Universidade Estadual de Maringá. Maringá, Brasil. Disponível em: <http://www.redalyc.org/articulo.oa?id=287122083018> > Acesso em: 25 abr. 2015. https://repositorio.ufba.br/ri/bitstream/ufba/145/1/Para%20entender%20a%20ciencia%20da%20informacao.pdf https://repositorio.ufba.br/ri/bitstream/ufba/145/1/Para%20entender%20a%20ciencia%20da%20informacao.pdf http://www.uel.br/revistas/uel/index.php/geografia/article/viewFile/6658/6007 http://www.scielo.org.ve/scielo.php?script=sci_arttext&pid=S079807522009000200006&lng=es&nrm=iso http://www.scielo.org.ve/scielo.php?script=sci_arttext&pid=S079807522009000200006&lng=es&nrm=iso http://www.portalseer.ufba.br/index.php/revistaici/article/view/4524/4552 http://www.scielo.br/pdf/ci/v27n2/trzesniak.pdf http://dx.doi.org/10.1590/S0011-52582001000300005 http://www.redalyc.org/articulo.oa?id=287122083018