La Ciencia de Datos: ¿Ciencia social, o Ciencia exacta?

Ocurre con algunas áreas del conocimiento con una antigüedad y alcance tan amplios, que se ha dedicado la misma cantidad de tiempo estudiándolas a ellas que su propio objeto de estudio. Tal es el caso de la economía, o más concretamente, la ciencia económica. Lo interesante aquí es que los economistas clásicos destacan el aspecto social y factual de la economía, comparándola con la filosofía, mientras que otros la equiparaban con las ciencias naturales.

Los historicistas sentaron la idea de que la economía parte de la realidad histórica, mientras que economistas modernos, resaltan su carácter formal y fundamento en las ciencias exactas. Tomó siglos para que existiera algo cercano a un consenso teórico.

En la actualidad se nos presenta el mismo dilema con una herramienta mucho menos popular: la ciencia de datos. Comúnmente, es definida como una ciencia multidisciplinaria que utiliza el método científico, al igual que procesos y sistemas para extraer conocimiento y conclusiones a partir de conjuntos de datos con y sin estructura. Esta multidisciplinariedad nos pone en aprietos desde el principio, ya que confiesa que la ciencia de datos puede ser usada como auxiliar de cualquier otra ciencia y que no posee un objeto de estudio formal que la defina. Entonces, ¿cómo se debe categorizar?

Naturalmente, partimos de una especificidad técnica ultra-exacta cuando hablamos de un científico de datos, ya que, a diferencia de un científico social, el primero debe organizar su mundo en torno a la dicotomía binaria de “sí y “no”. El resultado que se obtuvo es o no es. No existe ambigüedad. Un experto en sociología, antropología, psicología o filología, por el otro lado, tiene un campo de acción más laxo que incluso invita a las múltiples interpretaciones de un mismo fenómeno. El conocimiento técnico del uso de herramientas estadísticas e informáticas se asemeja más al de un físico o un matemático. Con el creciente uso de herramientas de ciencia de datos aplicado a las ciencias sociales, podemos decir que éstas mismas están volviéndose más formales.

Por otra parte, la información que estas computadoras y sus maestros humanos trabajan en el campo de la social data science no es exacta en absoluto, sino completamente orgánica. Las bases de datos formadas por opiniones, contenidos digitales generados por usuarios, encuestas, y perfiles son sumamente heterogéneas de manera que es difícil encontrar dos resultados individuales iguales. Es aquí donde entran herramientas como la inteligencia artificial y el machine learning. Solo un algoritmo modelado a la perfección podrá tomar datos propios de las ciencias sociales, tan extensos que una persona pasaría años leyéndola, y convirtiéndola en resultados cuantificables, y maleables.

La ciencia de datos es entonces una clase de híbrido completamente nueva, que cambia por completo la noción que tenemos de las ciencias sociales y exactas, y que ni la economía, ni la física, ni la antropología, se pueden equiparar. El siguiente paso es adiestrarnos para formar una nueva generación de investigadores que logren cerrar una brecha con milenios de antigüedad.

-Rodrigo Ugarte

Leave a Reply

Your email address will not be published. Required fields are marked *