viernes, 2 de agosto de 2013

Tener bebés más rápidamente con Big Data

Una nueva aplicación para iPhone y iPad, Ovuline’s Smart Fertility, emplea técnicas de aprendizaje automático (machine learning) y big data para ayudar a las mujeres a quedarse embarazadas.

Son muchas las apps para Smartphone que permiten hacer un seguimiento del ciclo menstrual de la mujer. Pero la app de la empresa Ovuline, una startup con sede en Cambridge (Massachussets, USA) fundada en 2012, se diferencia de las demás en el uso de análisis de datos masivos para predecir el mejor momento de concebir.

link


Según su CEO, Paris Wallace, “Una de las principales razones por las que una mujer necesita, de media, entre 4 y 6 meses para concebir es porque no hace una predicción precisa de su ovulación. Las usuarias que nos informan de que se han quedado embarazadas, suelen tardar unos 60 días en conseguirlo, que es unas 3 veces más rápido que la media nacional [de USA]. Así que nuestro algoritmo de predicción parece que está funcionando.”

La app de Ovuline puede ser usada por cualquier mujer, pero parece ser especialmente atractiva para las parejas que esperan hasta los 30 o los 40 para tener niños. “Cuando quieren tener un bebé”, Dice Wallace, “quieren el embarazo inmediatamente. Y cuando no lo consiguen tras varias semanas o meses de intentarlo, prueban a que Ovuline les ayude a concebir.”

Las cifras 

En el mundo de la ayuda a la decisión clínica, uno de los principales obstáculos para obtener buenas herramientas de diagnóstico y predicción fiables y con capacidad de generalización es poder contar con un volumen de casos suficientemente alto. La gente de Ovuline parece haber dado con una fórmula sencilla para conseguirlo: Su app es totalmente gratuita. “Queremos tener tantos usuarios registrados en nuestro servicio y haciendo uso de él como sea posible. Obviamente, cuanto más datos tengamos, mejores será nuestro servicio y las predicciones de nuestros algoritmos de aprendizaje”.

Así, Ovuline cuenta ya con más de 4 millones de registros de datos de más de 70.000 mujeres. La información recogida va desde datos sobre la presión arterial, el peso, los fluidos cervicales, el ciclo menstrual, la temperatura corporal e incluso las relaciones sexuales. Para recolectar estos datos, no solo se recurre a la app para iPhone, sino también a dispositivos móviles portátiles de auto-monitorización.

Con el rápido crecimiento del volumen de datos que están experimentando, Ovuline está ya desarrollando otras aplicaciones para la salud. En otoño lanzarán un sistema para monitorizar el embarazo. “Las mujeres introducirán información y también recogeremos datos de los dispositivos de auto-monitorización”.

Via:
[informationweek]

lunes, 22 de julio de 2013

El trabajo más sexy del Siglo XXI

El pasado octubre de 2012 se publicó en Harvard Business Review un artículo firmado por Thomas H Davenport y D J Patil titulado “Data Scientist: el trabajo más sexy del siglo XXI”.

Reconozco que, como noticia, no es muy reciente, pero sí que sigue siendo una tendencia real: Según datos recogidos en el blog de NatureJobs y los datos de tendencias de empleo  de Indeed.com, la demanda de este tipo de profesionales se ha disparado en un 15.000% entre los veranos de 2011 y 2012.


Pero ¿qué es un Data Scientist? 


La propia definición de Data Scientist (Científico de datos, podría traducirse, aunque seguiré refiriéndome a ella como Data Scientist) es controvertida. Este término fue acuñado por D J Patil y Jeff Hammerbacher y esta es la historia que cuenta Patil en el epub “Building Data Science Teams” sobre cómo acuñaron este término cuando estaban montando sus respectivos equipos de datos para LinkedIn y Facebook respectivamente allá por 2008:

“Cuando Jeff Hammerbacher y yo hablábamos sobre nuestros equipos de datos, nos dimos cuenta de que, a medida que nuestras organizaciones crecían, ambos teníamos que buscar un nombre para referirnos a los miembros de nuestros equipos. ‘Analista de Negocio’ (Business analyst) parecía demasiado limitante. ‘Analista de datos’ (Data Analyst) era una opción, pero nos daba la sensación de que ese título pudiera limitar lo que la gente podría hacer. Después de todo, mucha de las personas en nuestros equipos poseía un profundo conocimiento ingenieril. ‘Científico de investigación’ (Research scientist) era un título de trabajo razonable empleado por compañías como Sun, HP, Xerox, Yahoo e IBM. Sin embargo, considerábamos que la mayoría de científicos de investigación trabajaba en proyectos abstractos y futuristas y que lo hacían en laboratorios aislados de los equipos de desarrollo de productos. Si llegaba a ocurrir, podían pasar años hasta que la investigación en laboratorio tuviera un impacto clave en los productos. En nuestros equipos, sin embargo, el objetivo era trabajar en aplicaciones de datos que tuvieran un impacto inmediato y significativo en el negocio. El término que mejor parecía encajar era el de Data Scientist: aquellos que empleaban datos y ciencia para crear algo nuevo.” 

¿Qué caracteriza a un Data Scientist?

 Aunque no hay una definición estandarizada de este término y tampoco existe (por el momento) una especialización universitaria para formarlos (por ahora provienen de diversas áreas), el mini-libro de Building Data Science Teams sí que aporta una serie de rasgos que los definen:

  • Experiencia técnica: Los mejores data scientists suelen tener un conocimiento profundo en alguna disciplina científica. 
  • Curiosidad: el deseo de ir más allá de la superficie de las cosas y descubrir y desmontar en trocitos un problema hasta que sea un conjunto claro de hipótesis que puedan testearse.
  • Cuentacuentos: la habilidad de emplear los datos para contar una historia y ser capaz de contarla con efectividad. 
  • Inventiva: La habilidad de enfocar un problema de formas diferentes y creativas. 

Nube de palabras para describir las habilidades de un Data Scientist. [link]

¿Qué busca un Data Scientist?

De acuerdo con el artículo de Davenport y Patil, para un data scientist, el sueldo es importante pero no lo es todo. Si trabajan en una empresa bien establecida, un buen sueldo es una señal de que se valora su trabajo; si trabajan para una start-up, que normalmente no puede permitirse sueldos tan elevados, un data scientist valora que se les incentive con participaciones de la empresa, una forma de reconocer la importancia que tienen en el negocio.

Pero lo que realmente les mueve son los retos que contribuyen a mejorar todo el negocio. Necesitan que le hagan las preguntas adecuadas, que se les sepa indicar qué se busca mejorar en la empresa o, mucho mejor, que se les permita descubrirlo por ellos mismos. Y para ello, exigen que se les dé libertad de maniobra para encontrar la solución: No significa que no se les pongan plazos de tiempo para presentar resultados, sino que se les faciliten los medios para acceder a todos los datos de la empresa que considere relevantes para obtener las respuestas.

Puede que el concepto de data scientist sea una moda. Y puede que sea pasajera, como lo fueron los Yupies, o los tiburones de Wall Street de los felices años noventa, pero lo que sí es cierto es que hay una necesidad real por parte de las empresas de analizar datos masivos de diversas fuentes. Existe el marco tecnológico (capacidad de almacenamiento y procesamiento prácticamente ilimitados) y, ahora, se está buscando a quién lo haga. Y ahí es donde los Data scientists se vuelven sexys…

Ha llegado un nuevo héroe, mitad empollón, mitad sexy: DataScienceMan [link]