Big data e inocuidad alimentaria.
El término big data (macrodatos en español) rara vez se utiliza en relación con la inocuidad alimentaria, principalmente porque los datos y la información se encuentran dispersos en los sectores de la alimentación, la salud y la agricultura. Sin embargo, en varias partes del mundo, los gobiernos están incentivando la publicación en Internet de todos los datos generados en proyectos de investigación financiados con fondos públicos. Esta política abre nuevas oportunidades comerciales para que los interesados en inocuidad alimentaria aborden temas que antes no eran posibles.
Por su parte, la aplicación de teléfonos móviles como dispositivos de detección para la inocuidad alimentaria y el uso de las redes sociales como alerta temprana de problemas de seguridad alimentaria son algunos ejemplos de los nuevos avances que son posibles gracias al big data.
Se están desarrollando enfoques de minería de datos y análisis de redes sociales para aprovechar la enorme cantidad de datos como sistemas de alerta temprana para la identificación de posibles problemas de salud y seguridad alimentaria que pueden convertirse en una crisis.
Almacenamiento de datos y transferencia.
Generalmente, el almacenamiento de datos se logra usando sistemas de administración de datos como MySQL, Oracle y PostgreSQL. Sin embargo, estos sistemas no son suficientes para soportar el manejo de big data. Se requiere más velocidad, flexibilidad y fiabilidad que en los sistemas tradicionales. Por lo tanto, se han desarrollado bases de datos de siguiente generación que son no relacionales, de código abierto y escalables horizontalmente y se denominan NoSQL. Ej. MongoDB, Cassandra, y HBase.
Análisis de datos.
Después de almacenar y mover los datos a la unidad de procesamiento en NoSQL, los datos deben procesarse. Los métodos de análisis más utilizados para big data se pueden clasificar en dos categorías: Sistema de recomendación y Aprendizaje automático.
Los sistemas de recomendación son sistemas de filtrado de información que obtienen las preferencias, el interés o el comportamiento observado de los consumidores y hacen recomendaciones en consecuencia. Tienen potencial para respaldar las decisiones que toman los consumidores al buscar y seleccionar productos en línea. Estos sistemas son utilizados por las organizaciones de comercio electrónico para asesorar a sus clientes basándose, por ejemplo, en los productos más vendidos en un sitio, la demografía del cliente, el análisis del comportamiento pasado del cliente, etc. Estos sistemas se desarrollan utilizando técnicas de minería de datos, ej. Amazon y Netflix. Estos sistemas aún no se aplican en inocuidad alimentaria.
El aprendizaje automático explora algoritmos que pueden aprender y hacer predicciones sobre los datos. El aprendizaje automático se emplea en los casos en los que el diseño de algoritmos es complejo y para construir modelos a partir de datos con el fin de hacer predicciones o decisiones. Se han iniciado algunos esfuerzos en temas de inocuidad alimentaria.
Ejemplos de big data en inocuidad de alimentos.
Cadena agrícola y cadena de suministro de alimentos
En la cadena agrícola, big data puede utilizarse para predecir la presencia de patógenos o contaminantes vinculando la información sobre los factores ambientales con el crecimiento de patógenos y/o la aparición de peligros. Por ejemplo, monitoreando las condiciones de los cultivos en el campo pueden identificarse las áreas con una mayor incidencia de aflatoxinas antes de ingresar a la cadena alimentaria.
En otro estudio, se desarrollaron modelos cuantitativos para predecir la contaminación de la micotoxina deoxinivalenol (DON) en el trigo en el noroeste de Europa utilizando una variedad de modelos y bases de datos, incluidos datos meteorológicos.
En la cadena de suministro, el seguimiento de los alimentos es necesario para garantizar retiradas rápidas. Esto se puede ampliar mediante el uso de tecnologías GPS, basadas en sensores y RFID. De esta manera, se pueden recolectar datos de tiempo real o cercano sobre las ubicaciones y otros atributos de los alimentos (ej. Temperatura).
Una gran cadena de restaurantes de EE. UU. (The Cheescake Factory) recopila grandes volúmenes de datos sobre la temperatura de transporte, la vida útil y las retiradas de alimentos, que son analizados por IBM Big Data Analytics.
Por su parte Walmart Stores Inc. utiliza un sistema de mantenimiento de registros y auditoría sostenible sin papeles (SPARK) que carga automáticamente datos (como la temperatura de los alimentos) a un sistema de mantenimiento de registros basado en la web. En un mes, las temperaturas internas de cocción de los pollos rostizados se midieron 10 veces por los funcionarios de salud, 100 veces por el personal interno y 1.4 millones de veces por SPARK. De esta manera, se recopilan muchos datos y se pueden utilizar para identificar rápidamente pollo mal cocido.
Identificación de brotes y origen
Durante un brote de inocuidad alimentaria se recolecta y analiza una gran cantidad de muestras, lo que da lugar a grandes volúmenes de datos e información que se utilizan para identificar la fuente del brote. El desarrollo de técnicas de detección rápida de genomas de patógenos da como resultado una recopilación de información genómica específica y la aparición (histórica) de cepas o subtipos patógenos. Se espera que dicha información de monitoreo pueda ayudar a detectar un problema en una etapa temprana, permitiendo tomar medidas preventivas oportunas y, en consecuencia, prevenir un brote.
Identificación de brotes a través de fuentes de datos alternas
Se utilizó modelado geoespacial para identificar a los mayoristas involucrados en la distribución de alimentos contaminados. En este modelo se incluyeron la red de distribución de los mayoristas, la densidad de población, la ubicación de los minoristas y el comportamiento del consumidor.
Un estudio analizó las reseñas de los clientes en línea sobre restaurantes (yelp.com) en busca de palabras clave relacionadas con la intoxicación alimentaria. Compararon los resultados con la base de datos de controles de brotes de los Centros para el Control y la Prevención de Enfermedades (CDC). Los autores postulan que estas revisiones proporcionan información casi en tiempo real sobre los brotes y pueden complementar los sistemas tradicionales de vigilancia.