Descubriendo millones de conjuntos de datos en la web.

Más es mejor?

Pablo Lucero - AI
2 min readJul 24, 2023
Foto de Reza Rostampisheh en Unsplash

En enero del 2020 Google laza oficialmente su buscador de datos (Dataset Search), indexando alrededor de 25 millones de conjuntos de casi cualquier tema.

Al disponer disponer de una inmensa cantidad de datos, la herramienta cuenta con un filtro por tipo de conjunto. Por ejemplo, tablas, imágenes, texto o si el conjunto esáa disponible de forma gratuita.

Sin embargo, ¡Cualquiera que publique sus datos puede hacer que sus conjuntos sean reconocibles en Dataset Search!

¿Quienes usan Dataset Search?

Hay investigadores académicos que encuentran datos para desarrollar sus hipótesis. Por ejemplo, prueben la oxitocina o buscan datos respecto al diagnóstico de fallas en maquinaria. Estudiantes que buscan datos gratuitos en formato tabular que cubran el tema de su tesis; tasas de encarcelamiento o incendios forestales. También están los analistas de negocios y científicos de datos que buscan información sobre aplicaciones móviles o establecimientos de comida rápida , etc.

¡Hay datos sobre todo eso!

¿Que es lo que más buscan los usuarios?

Existe una cantidad inmensa de datos que pueden ser utilizados en tus modelos de ML. Las consultas más comunes incluyen “educación”, “clima”, “cáncer”, “crimen”, “fútbol” y, sí, “perros”.

Si buscas datos para complementar tus investigaciones Dataset Search te facilitará el proceso.

--

--

Pablo Lucero - AI

Inteligencia artificial, Machine learning y Automatización.