
Resumen
El objetivo de este artículo es analizar los factores de posicionamiento (SEO) externos que pueden influir en la ordenación por relevancia en Google Scholar y luego identificar el peso de las citas recibidas en esta ordenación. Se ha aplicado una metodología de ingeniería inversa comparando el ranking de Google Scholar con un ranking formado tan sólo por el número de citas recibidas por los documentos. El estudio se realizó a partir de cuatro tipos de búsquedas sin palabras clave: por publicación, año, autor y “citado por”. Los resultados fueron coincidentes en las cuatro muestras con coeficientes de correlación entre los dos rankings superiores al 0,9. El presente estudio demuestra de forma más clara que en anteriores investigaciones que las citas recibidas es el factor SEO externo más relevante en el ranking de los resultados en Google Scholar. Los demás factores tienen una influencia mínima. Esta información proporciona una base sólida para la disciplina del posicionamiento.
1. Introducción
La optimización de motores de búsqueda (SEO) es el proceso empleado para optimizar los sitios web y su contenido para tener una buena posición en los listados de resultados de los buscadores (Enge; Spencer; Stricchiola, 2015). SEO también es una profesión bien establecida dentro de la nueva industria de la comunicación digital como demuestra la existencia de una amplia oferta de monografías, publicaciones profesionales y formación universitaria. Su objetivo es destacar la calidad de los documentos para aumentar su visibilidad en relación con los algoritmos que establecen las posiciones en los motores de búsqueda, especialmente Google. Este objetivo debe lograrse sin falsificar las características de los documentos y sin emplear medios fraudulentos.
Las páginas de resultados de búsqueda de Google están ordenadas por relevancia (Google, 2017), que se basa en más de 200 características, aunque Google no especifica cuáles son o su peso específico; simplemente proporciona información parcial y general, como por ejemplo que la calidad del contenido y los enlaces entrantes son dos factores predominantes (Ratcliff, 2016; Schwartz, 2016). El motivo indicado por Google para esta falta de transparencia es luchar contra el spam (Beel; Gipp, 2010). Si todos los detalles de los factores de ordenación estuvieran disponibles, documentos de baja calidad se podrían colocar en buenas posiciones. Sin embargo esta política de caja negra va en detrimento de los profesionales de SEO que llevan a cabo su actividad de una manera ética y cuyo trabajo se ve obstaculizado por la falta de información fiable.
Algunas empresas de SEO (Gielen; Rosen, 2016; Localseoguide,2016; MOZ, 2015; Searchmetrics, 2016) realizan investigaciones de ingeniería inversa para medir el impacto de los factores involucrados en el proceso de posicionamiento de Google. En esas investigaciones se analizan muchas búsquedas para identificar los factores de posicionamiento en función de las características de las páginas ubicadas en las primeras posiciones. Dado que la cantidad de factores que intervienen en el proceso de posicionamiento es grande, es extremadamente difícil establecer qué factores son realmente relevantes y en qué medida influyen en la ordenación final de los documentos. Además el proceso de posicionamiento en Google es altamente dinámico, ya que el algoritmo sufre docenas de cambios por año (MOZ, 2017).
En los últimos años el SEO se ha aplicado a los motores de búsqueda académicos, denominándose este nuevo proceso como SEO académico (ASEO) (Beel; Gipp, 2009b, 2010; Codina,2016; Martín-Martín et al., 2016a; Muñoz-Martín, 2015). Los autores ponen cada vez más énfasis en mejorar la visibilidad de sus artículos en los buscadores académicos. Los artículos que aparecen en las primeras posiciones aumentan su visibilidad y por tanto tienen una mayor probabilidad de ser leídos y citados, lo que a su vez aumenta las probabilidades de mejorar el índice h personal de sus autores (Farhadi et al., 2013).
En muchos casos los mismos procedimientos de optimización utilizados con éxito en Google se están aplicando a Google Scholar. Sin embargo este último tiene su propio algoritmo. Aunque pocos estudios abordan los factores de ordenación específicos de Google Scholar, algunos que pueden citarse son: Beel y Gipp (2009b; 2009c; 2010); Beel, Gipp y Wilde (2010); Martín-Martín et al. (2014; 2017); Orduña-Malea et al. (2016).
El objetivo del presente estudio es analizar las características de los documentos que pueden influir en la ordenación por relevancia en Google Scholar, y particularmente nos interesan las citas recibidas por los artículos. El objetivo es evaluar la influencia del número de citas recibidas en el algoritmo de ordenación. La cantidad de veces que se cita un documento es una característica clave para determinar la especificidad del proceso de ordenación de Google Scholar.
Pensamos que la influencia de las citas es mucho mayor de lo que generalmente piensan autores y editores. Por ejemplo, las instrucciones para los autores de las publicaciones académicas proporcionan sugerencias sobre cómo mejorar la posición de los artículos en el ranking en Google Scholar (Elsevier, 2012; Wiley, 2015; Emerald Publishing Limited, 2017). En estas guías las citas recibidas no se mencionan o se tratan sin la importancia que tienen.
Este artículo presenta los resultados de un estudio de ingeniería inversa que utiliza un nuevo método de análisis. Este método permite bloquear algunos factores del algoritmo de posicionamiento, en concreto aquellos que dependen de elementos externos de la página ordenada. De este modo se puede enfocar el estudio sobre un pequeño conjunto de factores que son estudiados con mayor control.

La hipótesis que se plantea es que si se compara la ordenación aplicando sólo el número de citas recibidas con la ordenación estándar de Google Scholar en búsquedas donde sólo participan factores externos, se puede identificar el peso de las citas en el conjunto de estos factores externos.Si los dos rankings comparados son similares entonces las citas tendrán un peso importante.
(…)
Acceso al artículo completo versión española
—
Full text English version
—
Referencia versión en castellano
Rovira, Cristòfol; Guerrero-Solé, Frederic; Codina, Lluís (2018). “Received citations as a main SEO factor of Google Scholar results ranking”. El profesional de la información, v. 27, n. 3, pp. 559-569. https://doi.org/10.3145/epi.2018.may.09
Reference English version
Rovira, Cristòfol; Guerrero-Solé, Frederic; Codina, Lluís (2018). “Received citations as a main SEO factor of Google Scholar results ranking”. El profesional de la información, v. 27, n. 3, pp. 559-569. https://doi.org/10.3145/epi.2018.may.09
Bibliografía citada en el artículo
Aguillo, I.F. (2012). «Is google scholar useful for bibliometrics? A webometric analysis». Scientometrics, v. 91, n. 2, pp. 343-351. https://doi.org/10.1007/s11192-011-0582-8
Beel, J.; Gipp, B. (2009a). «Google scholar’s ranking algorithm: an introductory overview». In: Proceedings of the 12th international conference on scientometrics and informetrics, ISSI’09, pp. 230-241.
Beel, J.; Gipp, B. (2009b). «Google scholar’s ranking algorithm: the impact of articles’ age (an empirical study)». In: Sixth international conference on information technology: new generations, ITNG’09, pp. 160-164.
Beel, J.; Gipp, B. (2009c). «Google scholar’s ranking algorithm: the impact of citation counts (an empirical study)». In: Third international conference on research challenges in information science, RCIS 2009, pp. 439-446.
Beel, J.; Gipp, B. (2010). «Academic search engine spam and google scholar’s resilience against it». The Journal of Electronic Publishing, v. 13, n. 3, pp. 1-28. https://doi.org/10.3998/3336451.0013.305
Beel, J.; Gipp, B.; Wilde, E. (2010). «Academic search engine optimization (ASEO) optimizing scholarly literature for google scholar & co». Journal of Scholarly Publishing, v. 41, n. 2, pp. 176-190. https://doi.org/10.3138/jsp.41.2.176
Codina, L. SEO académico: definición, componentes y guía de herramientas. https://www.lluiscodina.com/seo-academico-guia/
de Groote, S.L.; Raszewski, R. (2012). «Coverage of google scholar, scopus, and web of science: a case study of the h-index in nursing». Nursing Outlook, v. 60, n. 6, pp. 391-400. https://doi.org/10.1016/j.outlook.2012.04.007
de Winter, J.C.F.; Zadpoor, A.A.; Dodou, D. (2014). «The expansion of google scholar versus web of science: a longitudinal study». Scientometrics, v. 98, n. 2, pp. 1547-1565. https://doi.org/10.1007/s11192-013-1089-2
Elsevier. Get found: optimize your research articles for search engines, Elsevier. http://www.elsevier.com/early-career-researchers/guides-and-recommended-reading
Enge, E.; Spencer, S.; Stricchiola, J. (2015). The art of SEO: mastering search engine optimization. Sebastopol CA: O’Reilly Media, ISBN: 9781491903643: https://books.google.co.in/books?id=hg5iCgAAQBAJ
Farhadi, H.; Salehi, H.; Yunus, M.M.; Aghaei Chadegani, A.; Farhadi, M.; Fooladi, M.; Ale Ebrahim, N. (2013). «Does it matter which citation tool is used to compare the h-index of a group of highly cited researchers?». Australian Journal of Basic and Applied Sciences, v. 7, n. 4, pp. 198-202. https://ssrn.com/abstract=2259614
Gielen, M.; Rosen, J. Reverse engineering the youtube, tubefilter.com. http://www.tubefilter.com/2016/06/23/reverse-engineering-youtube-algorithm/
Giustini, D.; Boulos, M.N.K. (2013). «Google Scholar is not enough to be used alone for systematic». Online Journal of Public Health Informatics, v. 5, n. 2, pp. 1-9. https://doi.org/10.5210/ojphi.v5i2.4623
Google. About google scholar, about google scholar. http://scholar.google.com/intl/en/scholar/about.html
Google. How google search works. Learn how google discovers, crawls, and serves web pages, search console help. https://support.google.com/webmasters/answer/70897?hl=en
Harzing, A.W. (2011). The publish or perish book: your guide to effective and responsible citation analysis. Melbourne, Australia: Tarma Software Research Pty Ltd, ISBN: 978 1 60752 120 4 https://EconPapers.repec.org/RePEc:spr:scient:v:88:y:2011:i:1:d:10.1007_s11192-011-0388-8
Harzing, A.W. (2013). «A preliminary test of google scholar as a source for citation data: a longitudinal study of nobel prize winners». Scientometrics, v. 94, n. 3, pp. 1057-1075. https://doi.org/10.1007/s11192-012-0777-7
Harzing, A.W. (2014). «A longitudinal study of google scholar coverage between 2012 and 2013». Scientometrics, v. 98, n. 1, pp. 565-575. https://doi.org/10.1007/s11192-013-0975-y
Jacso, P. (2008a). «Testing the calculation of a realistic h-index in google scholar, scopus, and web of science for FW Lancaster». Library Trends, v. 56, n. 4, pp. 784-815. https://doi.org/10.1353/lib.0.0011
Jacsó, P. (2008b). «The pros and cons of computing the h-index using google scholar». Online Information Review, v. 32, n. 3, pp. 437-452. https://doi.org/10.1108/14684520810889718
Jacsó, P. (2009). «Calculating the h-index and other bibliometric and scientometric indicators from google scholar with the publish or perish software». Online Information Review, v. 33, n. 6, pp. 1189-1200. https://doi.org/10.1108/14684520911011070
Jacsó, P. (2012). «Using Google scholar for journal impact factors and the h-index in nationwide publishing assessments in academia–siren songs and air-raid sirens». Online Information Review, v. 36, n. 3, pp. 462-478. https://doi.org/10.1108/14684521211241503
Jamali, H.R.; Asadi, S. (2010). «Google and the scholar: the role of Google in scientists’ information-seeking behaviour». Online Information Review, v. 34, n. 2, pp. 282-294. https://doi.org/10.1108/14684521011036990
Jamali, H. R.; Nabavi, M. (2015). «Open access and sources of full-text articles in Google Scholar in different subject fields». Scientometrics, v. 105, n. 3, pp. 1635-1651. https://doi.org/10.1007/s11192-015-1642-2
Lemon, J. (2006). «Plotrix: a package in the red light district of R». R-News, v. 6, n. 4, pp. 8-12.
Localseoguide. Local SEO ranking factors study 2016, localseoguide. http://www.localseoguide.com/guides/2016-local-seo-ranking-factors/
López-Cózar, E.; Robinson-García, N.; Torres-Salinas, D. (2012). Manipular google scholar citations y google scholar metrics: simple, sencillo y tentador, EC3 working papers. Granada: Universidad de Granada. http://hdl.handle.net/10481/20469
López-Cózar, E.; Robinson-García, N.; Torres-Salinas, D. (2014). «The Google scholar experiment: how to index false papers and manipulate bibliometric indicators». Journal of the Association for Information Science and Technology, v. 65, n. 3, pp. 446-454. https://doi.org/10.1002/asi.23056
Maciá, F. (2015). SEO: técnicas avanzadas. Barcelona: Anaya.
Marcos, M.-C.; González-Caro, C. (2010). «Comportamiento de los usuarios en la página de resultados de los buscadores. Un estudio basado en eye tracking». El profesional de la Información, v. 19, n. 4, pp. 348-358. https://doi.org/10.3145/epi.2010.jul.03
Martín-Martín, A.; Ayllón, J.M.; Orduña-Malea, E.; López-Cózar, E.D. (2016a). Google Scholar Metrics released: a matter of languages… and something else. Granada: Universidad de Granada. https://arxiv.org/abs/1607.06260v1
Martín-Martín, A.; Orduna-Malea, E.; Ayllón, J. M.; Delgado López-Cózar, E. D. (2016b). «Back to the past: on the shoulders of an academic search engine giant». Scientometrics, v. 107, n. 3, pp. 1477-1487. https://doi.org/10.1007/s11192-016-1917-2
Martín-Martín, A.; Orduña-Malea, E.; Ayllón, J.M.; López-Cózar, E.D. (2014). Does Google Scholar contain all highly cited documents (1950-2013)? EC3 working papers. Granada: Universidad de Granada. https://arxiv.org/abs/1410.8464
Martín-Martín, A.; Orduna-Malea, E.; Harzing, A.W.; Delgado López-Cózar, E. (2017). «Can we use Google Scholar to identify highly-cited documents?.» Journal of Informetrics, v. 11, n. 1, pp. 152-163. https://doi.org/10.1016/j.joi.2016.11.008
Mayr, P.; Walter, A.-K. (2007). «An exploratory study of google scholar». Online Information Review, v. 31, n. 6, pp. 814-830. https://doi.org/10.1108/14684520710841784
Merton, R. K. (1968). «The Matthew effect in science: the reward and communication systems of science are considered». Science, v. 159, n. 3810, pp. 56-63. https://doi.org/10.1126/science.159.3810.56
Moed, H. F.; Bar-Ilan, J.; & Halevi, G. (2016). «A new methodology for comparing Google Scholar and Scopus». Journal of Informetrics, v. 10, n. 2, pp. 533-551. https://doi.org/10.1016/j.joi.2016.04.017
MOZ. Search engine ranking factors 2015, moz.com. https://moz.com/search-ranking-factors/correlations
MOZ. Google algorithm change history, moz.com. https://moz.com/google-algorithm-change
Muñoz-Martín, B. (2015). «Incrementa el impacto de tus artículos y blogs: de la invisibilidad a la visibilidad». Revista de la Sociedad Otorrinolaringológica de Castilla y León, Cantabria y La Rioja, v. 6, n. Suppl. 4, pp. 6-32. http://hdl.handle.net/10366/126907
Orduña-Malea, E.; Ayllón, J.M.; Martín-Martín, A.; López-Cózar, E.D. (2014). About the size of Google Scholar: playing the numbers. EC3 working papers. Granada: Universidad de Granada.
Orduña-Malea, E.; Ayllón, J. M., Martín-Martín, A.; Delgado López-Cózar, E. (2015). «Methods for estimating the size of Google Scholar». Scientometrics, v. 104, n. 3, pp. 931-949. https://doi.org/10.1007/s11192-015-1614-6
Orduna-Malea, E.; Martín-Martín, A.; Ayllón, J.; Delgado López-Cózar, E. (2016). La revolución google scholar: destapando la caja de Pandora académica. Granada: Editorial Universidad de Granada. University of New England, ISBN: 9788433859419
Pedersen, L.A.; Arendt, J. (2014). «Decrease in free computer science papers found through google scholar». Online Information Review, v. 38, n. 3, pp. 348-361. https://doi.org/10.1108/OIR-07-2013-0159
Ratcliff, C. WebPromo’s Q&A with google’s Andrey Lipattsev, search engine watch. https://searchenginewatch.com/2016/04/06/webpromos-qa-with-googles-andrey-lipattsev-transcript
Revelle, W. Psych: procedures for personality and psychological research, Northwestern University. https://CRAN.R-project.org/package=psych
Schwartz, B. Now we know: here are google’s top 3 search ranking factors, search engine land. http://searchengineland.com/now-know-googles-top-three-search-ranking-factors-245882
Searchmetrics. Rebooting ranking factors. http://www.searchmetrics.com/knowledge-base/ranking-factors/
Team, R.C. R: a language and environment for statistical computing, R foundation for statistical computing. https://www.R-project.org
Torres-Salinas, D.; Ruiz-Pérez, R.; Delgado-López-Cózar, E. (2009). «Google scholar como herramienta para la evaluación científica». El Profesional de la Información, v. 18, n. 5, pp. 501-510. https://doi.org/10.3145/epi.2009.sep.03
van Aalst, J. (2010). «Using google scholar to estimate the impact of journal articles in education». Educational Researcher, v. 39, n. 5, pp. 387-400. http://journals.sagepub.com/doi/abs/10.3102/0013189X10371120
van der Graaf, P. Reverse engineering search engine algorithms is getting, searchenginewatch. https://searchenginewatch.com/sew/how-to/2182553/reverse-engineering-search-engine-algorithms-getting-harder
Walters, W.H. (2008). «Google scholar search performance: Comparative recall and precision». portal: Libraries and the Academy, v. 9, n. 1, pp. 5-24. https://doi.org/10.1353/pla.0.0034
Wiley. Writing for SEO. https://authorservices.wiley.com/author-resources/Journal-Authors/Prepare/writing-for-seo.html
Acceso al artículo completo versión española
Full text access English version