“Imagínate un modelo que tuviéramos, por ejemplo, de la Ciudad de México, de Guadalajara o de Querétaro, pero tan detallado que no nada más modelara los edificios, sino también el comportamiento de las personas. A qué hora salen, cómo se desplazan, cuáles son los trayectos que usan, cuáles son sus necesidades a la hora de comer, en cuestiones de seguridad, dónde están las escuelas, cuánta gente atiende a estas escuelas, a donde se están movilizando los https://www.javiergosende.com/ciencia-datos-inteligencia-artificial estudiantes. Otro ejemplo es el de Pedro Ponce quien trabaja en la recolección y uso de datos para mejorar las ciudades y promover que sean cada vez más inteligentes, seguras y sostenibles. Por ejemplo, en 2014, el equipo reclutó por 500,000 dólares a Andre Gray, un futbolista de sexta división que, aunque parecía un movimiento sin mucho sentido, los datos de sus partidos indicaron que podría mejorar y posteriormente fue vendido por 12 millones.
Los análisis revelan que los clientes olvidan las contraseñas durante los periodos de pico de compra y que no están satisfechos con el actual sistema de recuperación de contraseñas. La empresa puede innovar para obtener una mejor solución y ver un aumento significativo en la satisfacción del cliente. Depósito de aprendizaje automático de UCI Actualmente mantiene 622 conjuntos de datos aptos para que los científicos de datos e ingenieros de ML entrenen sus modelos de IA.
Filtros, formatos condicionales, funciones, gráficos, tablas dinámicas y macros son sólo algunas de las funcionalidades clave que presenta Excel para trabajar con datos. Además, estos 3 artículos son la continuación del post “¿Qué son el Data Science, Big Data, Inteligencia Artificial, Machine Learning y Deep Learning (y en qué se diferencian)? “Es un error capital teorizar antes de tener datos. Insensiblemente, uno empieza a tergiversar los hechos para adaptarlos a las teorías, en lugar de que las teorías se adapten a los hechos”, proclama Sherlock Holmes en Un escándalo en Bohemia, de Sir Arthur Conan Doyle. Apuntes de cómo realizar los distintos tipos de ANOVA en R para comparar múltiples medias.
Consisten de 344 observaciones de pingüinos de tres especies, las cuales habitan en tres islas del archipiélago Palmer, en la Antártida. Para cada individuo se registraron variables como especie, sexo, masa (peso), longitud de la aleta (flipper), longitud del pico (bill) y profundidad del pico, entre otras. Hay otros paquetes para tareas más especifícas relacionadas con importación, limpieza y modelado de datos, entre otras.
En un nivel más fundamental, señalan el camino hacia una mayor eficiencia y reducción de costos. La ciencia de datos también permite a las empresas crear planes y estrategias comerciales que se basan en un análisis informado del comportamiento del cliente, las tendencias del mercado y la competencia. La ciencia de datos está ayudando a las empresas a tomar mejores decisiones y a crecer a través de conocimientos basados en datos. QuestionPro Research ofrece herramientas de investigación de mercado y de conocimiento de las partes interesadas para recopilar datos. Tiene varias características y herramientas para ayudar a las organizaciones a producir y difundir encuestas, analizar e interpretar los resultados y tomar decisiones informadas basadas en la investigación. Se utilizan en muchas empresas para tomar decisiones, mejorar las operaciones y encontrar nuevas oportunidades.
Luego, comparto el flujo de trabajo (“workflow”) que he usado en la mayoría de proyectos de ciencia de datos en los que he participado y describiré las etapas que lo componen. Esto puede parecer obvio, pero en la práctica, no todas las organizaciones están tan orientadas a los datos como podrían estarlo. Según la empresa de consultoría de gestión global McKinsey Global Institute, las empresas que se basan en los datos son mejores a la hora de captar nuevos clientes, mantener su fidelidad y lograr una rentabilidad superior a la media [2]. El análisis prescriptivo toma toda la información obtenida de los tres primeros tipos de análisis y la utiliza para formular recomendaciones sobre cómo debe actuar una empresa. Utilizando nuestro ejemplo anterior, este tipo de análisis podría sugerir un plan de mercado para aprovechar el éxito de los meses de altas ventas y aprovechar nuevas oportunidades de crecimiento en los meses más lentos.
El empleo de este modelo de datos es común en todos los paquetes de Tidyverse, lo que posibilita aprender y usar sus funciones con mayor facilidad. Además, permite invertir menos esfuerzo en lidiar con diferentes modelos de datos Diferencia entre los datos NoSQL y los datos relacionales y así dedicar más tiempo y esfuerzo en los problemas de análisis a resolver. Los paquetes de Tidyverse comparten filosofía de diseño, gramática y estructuras de datos para apoyar estos procesos del modelo de ciencia de datos.