¿Cuál es la palabra más repetida en español?
De hecho, la palabra que más usamos los hispanohablantes es la preposición "de", seguida de "la", "que", "el", "en", "y", "a", "los", "se" y "del".
No debe extrañar, ya que estas preposiciones, pronombres y conjunciones son los comodines de nuestra lengua y funcionan en la oración como el cemento que fragua sujetos, complementos directos, verbos y demás elementos de la oración.
Sólo hasta esta misma frase, en los tres párrafos esta pieza ya se ha repetido "de" unas 9 veces, "la" otras 10, "que" 8 veces y "en" hasta en 4 ocasiones, analiza Rubén Díaz Caviedes en el diario El Confidencial.
El primer verbo de la lista aparece en la posición 19 y se trata, por supuesto, del copulativo ser –en concreto, de su tercera persona del singular del presente de indicativo, "es"–. Más tarde aparecen "está" –en la posición 50–, "han" –en la 55– y "puede" –en la 59–.
El primer sustantivo entre las palabras más usadas en castellano es "tiempo"y aparece en la posición 70 de la lista, seguido de "vida" –76–, "gobierno" –86–, "día" –90–, "país" –98– y "mundo" –101–.
Según explica la propia Academia, el 10% de los textos del CREA proceden de la lengua oral y el 90% de la escrita. De este 90%, a su vez, "un 49% son libros, otro 49% es prensa" y un 2% marginal es lo que lo que la RAE denomina miscelánea. "Folletos, prospectos, correos electrónicos, ciberbitácoras, etcétera". Este criterio explica la recurrencia de términos abundantes en periodismo –como la palabra "presidente", que aparece en la posición 115, o "millones", en la 132– y justifica la gran ausencia de la lista: los tacos. "Carajo" aparece en la posición 7.795 de la lista y una palabra tan frecuente como "coño" no aparece hasta la 8.379.
Es posible que el lector español tampoco encuentre demasiados localismos entre estas repeticiones, ya que el 50% de los materiales muestreados proceden de nuestro país y el otro 50% de Hispanoamérica.
Este sesgo, sin embargo, explica que la palabra "España", en la posición 134, sea la nacionalidad más recurrente en nuestro léxico, seguida de "México" –367–, "Argentina" –681–, "Colombia" – 1.110– y "Venezuela" – 1.336–. "América" aparece en la posición 671 y "Latinoamérica" no sale hasta que llegamos a la 5.885. Uno de los países con más hispanohablantes del mundo, Estados Unidos, no aparece en esta lista técnica porque su nombre es una construcción de dos términos. En la lista solo aparecen "estados" en la posición 219 y "unidos" en la 287.
El nombre de persona más común de la lengua castellana, "María", es a la vez la palabra 286 de la lista de las más repetidas. "José" aparece en la posición "183" y "Antonio", en la 396.
Según la RAE, "el CREA es la única herramienta lingüística de gran magnitud existente para nuestra lengua", por lo que no solo sirve de herramienta para los académicos, sino que está disponible para su análisis estadístico en la elaboración de productos tan dispares como "gramáticas, diccionarios, tesauros, correctores ortográficos, métodos de didáctica del español, desarrollos informáticos de traducción automática".

