Big data e inocuidad alimentaria.
El término big data (macrodatos en español) rara vez se utiliza en relación con la inocuidad alimentaria, principalmente porque los datos y la información se encuentran dispersos en los sectores de la alimentación, la salud y la agricultura. Sin embargo, en varias partes del mundo, los gobiernos están incentivando la publicación en Internet de todos los datos generados en proyectos de investigación financiados con fondos públicos. Esta política abre nuevas oportunidades comerciales para que los interesados en inocuidad alimentaria aborden temas que antes no eran posibles.


Por su parte, la aplicación de teléfonos móviles como dispositivos de detección para la inocuidad alimentaria y el uso de las redes sociales como alerta temprana de problemas de seguridad alimentaria son algunos ejemplos de los nuevos avances que son posibles gracias al big data.

¿Qué es Big data? Existen muchas definiciones. La Organización Mundial de Salud (OMS) utiliza el término big data como: “el uso emergente de datos complejos recopilados rápidamente en cantidades sin precedentes que, incluso, pueden ser necesarios terabytes (1012 bytes), petabytes (1015 bytes) o incluso zettabytes (1021 bytes) para su almacenamiento”. Otra definición de big data es: “Activos de información caracterizados por ser de alto volumen, velocidad y variedad que requieren tecnología específica y métodos analíticos para su transformación a un valor”. (Mauro et al, 2015). En todas las definiciones el volumen se refiere a la cantidad de información, la velocidad es la rapidez con la que se genera la información y qué tan rápido se procesa, y la variedad representa la variación en el formato de la información (datos estructurados y datos no estructurados). El valor se refiere al costo de la generación de datos y su valor intrínseco. Por tanto, se puede entender big data como la tecnología que puede manejar grandes cantidades de datos estructurados y no estructurados de diversas fuentes y orígenes que abre nuevas áreas de investigación y aplicaciones que tendrán un impacto creciente en la sociedad. Nota: La información no estructurada es aquella no organizada, como los Tweets de Twitter y lo publicado por los usuarios en las redes sociales.
Adicional a las características de big data: volumen, velocidad, variedad y valor, también pueden ser consideradas la veracidad y la validez. La veracidad es la incertidumbre debida a la insuficiencia, a aproximaciones e inconsistencias (IBM,2012). La validez es el cuestionamiento de si los datos son válidos para el problema y tienen una base sólida en la lógica o en los hechos. Nota: La información no estructurada es aquella no organizada, como los Tweets de Twitter y lo publicado por los usuarios en las redes sociales.
Aplicaciones de big data en la inocuidad de alimentos. La OMS ha adoptado recientemente el enfoque de big data para apoyar la toma de decisiones en seguridad alimentaria, lo que ha dado lugar a una plataforma de seguridad alimentaria llamada «FOSCOLLAB» a través de la cual se integran diferentes fuentes de diversas disciplinas. En esta plataforma, los datos estructurados y no estructurados de múltiples sectores tales como salud animal, agricultura, alimentación, salud pública e indicadores económicos están integrados y disponibles para el usuario a través de cuadros de mando.
Lavado_del_area
FOSCOLLAB es una plataforma de la OMS para profesionales de la inocuidad alimentaria. Fuentes de datos habilitadas en FOSCOLLAB Base de datos de evaluaciones del Comité Mixto FAO / OMS de Expertos en Aditivos Alimentarios (JECFA). Sistema de Monitoreo del Medio Ambiente Mundial – Programa de Monitoreo y Evaluación de la Contaminación de Alimentos (SIMUVIMA / Alimentos). Dietas de grupos de alimentos / SIMUVIMA – 2012. Base de datos mundial de los Centros Colaboradores de la OMS (WHOCC). Red de autoridades internacionales de seguridad alimentaria (INFOSAN). Inventario de evaluaciones de la Reunión Conjunta FAO / OMS sobre Residuos de Plaguicidas (JMPR). Banco de datos de países de la Red mundial de infecciones de transmisión alimentaria (GFN). Grupo Asesor de la OMS sobre Vigilancia Integrada de la Resistencia a los Antimicrobianos (AGISAR) – Base de datos WHONET.
Lavado_del_area
Colección de datos de inocuidad alimentaria. Se pueden distinguir varios tipos de fuentes que pueden contener o generar información útil para la inocuidad alimentaria como: bases de datos (en línea), Internet, perfiles ómicos, teléfonos móviles y redes sociales. El desafío es identificar datos relevantes dentro de una fuente de datos y vincularlos a otras fuentes de datos. A) Bases de datos (en línea) En la tabla 1 se muestra una lista de bases de datos en línea que contienen información relacionada a inocuidad alimentaria (directamente/indirectamente) tal como información de peligros (ej. programas de monitoreo, sistemas de alerta, sustancias químicas), exposición (ej. bases de dato de consumo) y reportes de vigilancia de enfermedades en plantas y animales. Tabla 1. Bases de datos de inocuidad alimentaria.
Lavado_del_area
B) Internet Internet es una enorme fuente de información que puede ser explotada para ayudar la gestión de riesgos para la inocuidad. Se han desarrollado sistemas de rastreo web que buscan en Internet publicaciones sobre informes relacionados con la seguridad alimentaria. Un ejemplo típico de este sistema es MedISys. MedISys es un sistema de vigilancia completamente automático que recopila informes de Internet las 24 horas del día, los 7 días de la semana, sobre enfermedades infecciosas en personas y animales, que también se ha adaptado para recopilar publicaciones relacionadas con la inocuidad alimentaria. Un análisis de este sistema demostró que puede utilizarse como un sistema de alerta temprana para la detección de peligros transmitidos por alimentos y piensos.
C) Archivos (en línea) de datos de genómica funcional. Ómica es un término que abarca múltiples disciplinas, incluida la genómica (estudios sobre los efectos de las variaciones de nucleótidos dentro de los genes), transcriptómica (expresión de ARNm), metabolómica (niveles de metabolitos) y proteómica (niveles de péptidos y proteínas).
Lavado_del_area
El enfoque principal para desarrollar ensayos predictivos basados en la toxicogenómica para la seguridad química, y en particular con el propósito de identificar los peligros, implica que las bases de datos genómicas a gran escala se deriven de la exposición de células o animales a tóxicos conocidos.
D) Teléfonos móviles. El uso de teléfonos móviles está generalizado y aparecen rápidamente nuevas aplicaciones, incluidas aplicaciones relacionadas con la inocuidad alimentaria y la salud. Han aparecido informes sobre el uso de teléfonos inteligentes (smartphones) en combinaciones con otros dispositivos portátiles para medir, por ejemplo: contaminación por mercurio en el agua, contaminación de Ocratoxina A en cerveza, alérgenos en una variedad de productos alimenticios, contaminaciones microbianas (E. coli) en agua y muestras de alimentos.
Lavado_del_area
Los datos recopilados se pueden procesar en el teléfono o mediante una computadora conectada a WiFi para su propio propósito, pero también se pueden transferir a nubes de datos u otros centros de datos.
E) Redes sociales. Las agencias de seguridad alimentaria y las organizaciones asociadas a la alimentación también están utilizando las redes sociales como Facebook, Twitter y YouTube para comunicarse con el público en general sobre temas relacionados con la inocuidad alimentaria. Al monitorear las conversaciones de los usuarios en las redes sociales, las agencias de alimentos comprenderán mejor su audiencia y pueden detectar nuevos problemas.
Lavado_del_area

Se están desarrollando enfoques de minería de datos y análisis de redes sociales para aprovechar la enorme cantidad de datos como sistemas de alerta temprana para la identificación de posibles problemas de salud y seguridad alimentaria que pueden convertirse en una crisis.

Almacenamiento de datos y transferencia.

Generalmente, el almacenamiento de datos se logra usando sistemas de administración de datos como MySQL, Oracle y PostgreSQL. Sin embargo, estos sistemas no son suficientes para soportar el manejo de big data. Se requiere más velocidad, flexibilidad y fiabilidad que en los sistemas tradicionales. Por lo tanto, se han desarrollado bases de datos de siguiente generación que son no relacionales, de código abierto y escalables horizontalmente y se denominan NoSQL. Ej. MongoDB, Cassandra, y HBase.

Análisis de datos.

Después de almacenar y mover los datos a la unidad de procesamiento en NoSQL, los datos deben procesarse. Los métodos de análisis más utilizados para big data se pueden clasificar en dos categorías: Sistema de recomendación y Aprendizaje automático.

Los sistemas de recomendación son sistemas de filtrado de información que obtienen las preferencias, el interés o el comportamiento observado de los consumidores y hacen recomendaciones en consecuencia. Tienen potencial para respaldar las decisiones que toman los consumidores al buscar y seleccionar productos en línea. Estos sistemas son utilizados por las organizaciones de comercio electrónico para asesorar a sus clientes basándose, por ejemplo, en los productos más vendidos en un sitio, la demografía del cliente, el análisis del comportamiento pasado del cliente, etc. Estos sistemas se desarrollan utilizando técnicas de minería de datos, ej. Amazon y Netflix. Estos sistemas aún no se aplican en inocuidad alimentaria.

El aprendizaje automático explora algoritmos que pueden aprender y hacer predicciones sobre los datos. El aprendizaje automático se emplea en los casos en los que el diseño de algoritmos es complejo y para construir modelos a partir de datos con el fin de hacer predicciones o decisiones. Se han iniciado algunos esfuerzos en temas de inocuidad alimentaria.

Ejemplos de big data en inocuidad de alimentos.
Cadena agrícola y cadena de suministro de alimentos

En la cadena agrícola, big data puede utilizarse para predecir la presencia de patógenos o contaminantes vinculando la información sobre los factores ambientales con el crecimiento de patógenos y/o la aparición de peligros. Por ejemplo, monitoreando las condiciones de los cultivos en el campo pueden identificarse las áreas con una mayor incidencia de aflatoxinas antes de ingresar a la cadena alimentaria.
En otro estudio, se desarrollaron modelos cuantitativos para predecir la contaminación de la micotoxina deoxinivalenol (DON) en el trigo en el noroeste de Europa utilizando una variedad de modelos y bases de datos, incluidos datos meteorológicos.
En la cadena de suministro, el seguimiento de los alimentos es necesario para garantizar retiradas rápidas. Esto se puede ampliar mediante el uso de tecnologías GPS, basadas en sensores y RFID. De esta manera, se pueden recolectar datos de tiempo real o cercano sobre las ubicaciones y otros atributos de los alimentos (ej. Temperatura).
Una gran cadena de restaurantes de EE. UU. (The Cheescake Factory) recopila grandes volúmenes de datos sobre la temperatura de transporte, la vida útil y las retiradas de alimentos, que son analizados por IBM Big Data Analytics.
Por su parte Walmart Stores Inc. utiliza un sistema de mantenimiento de registros y auditoría sostenible sin papeles (SPARK) que carga automáticamente datos (como la temperatura de los alimentos) a un sistema de mantenimiento de registros basado en la web. En un mes, las temperaturas internas de cocción de los pollos rostizados se midieron 10 veces por los funcionarios de salud, 100 veces por el personal interno y 1.4 millones de veces por SPARK. De esta manera, se recopilan muchos datos y se pueden utilizar para identificar rápidamente pollo mal cocido.

Identificación de brotes y origen
Durante un brote de inocuidad alimentaria se recolecta y analiza una gran cantidad de muestras, lo que da lugar a grandes volúmenes de datos e información que se utilizan para identificar la fuente del brote. El desarrollo de técnicas de detección rápida de genomas de patógenos da como resultado una recopilación de información genómica específica y la aparición (histórica) de cepas o subtipos patógenos. Se espera que dicha información de monitoreo pueda ayudar a detectar un problema en una etapa temprana, permitiendo tomar medidas preventivas oportunas y, en consecuencia, prevenir un brote.

Identificación de brotes a través de fuentes de datos alternas
Se utilizó modelado geoespacial para identificar a los mayoristas involucrados en la distribución de alimentos contaminados. En este modelo se incluyeron la red de distribución de los mayoristas, la densidad de población, la ubicación de los minoristas y el comportamiento del consumidor.
Un estudio analizó las reseñas de los clientes en línea sobre restaurantes (yelp.com) en busca de palabras clave relacionadas con la intoxicación alimentaria. Compararon los resultados con la base de datos de controles de brotes de los Centros para el Control y la Prevención de Enfermedades (CDC). Los autores postulan que estas revisiones proporcionan información casi en tiempo real sobre los brotes y pueden complementar los sistemas tradicionales de vigilancia.

El futuro de Big data y la inocuidad de los alimentos En Europa, la Comisión Europea ha desarrollado una estrategia sobre big data y apoya una economía basada en datos. Apoyan el acceso abierto a los datos (p. Ej., acceso gratuito en línea a los resultados de investigación financiados por la UE, incluidas las publicaciones científicas y los datos de investigación). Esto implica proyectos financiados por la UE sobre seguimiento de cultivos para países en desarrollo, seguimiento de todo el ciclo de vida del producto, mejorar la eficiencia y la calidad del proceso de desarrollo de productos. En Estados Unidos, la administración Obama lanzó una «Iniciativa de Investigación y Desarrollo de Big Data» para mejorar enormemente las herramientas y técnicas necesarias para acceder, organizar y recopilar descubrimientos a partir de enormes volúmenes de datos digitales. La iniciativa aumentó el apoyo del gobierno y aceleró la capacidad de las agencias federales para extraer conocimientos de datos digitales grandes y complejos. Esto también alentó a las empresas privadas, el mundo académico, los gobiernos locales y las fundaciones a colaborar en nuevos proyectos de big data.
En todo el mundo se está produciendo una gran cantidad de datos relacionados directa e indirectamente con la seguridad alimentaria. Actualmente, solo se aplican en inocuidad alimentaria un número limitado de herramientas desarrolladas dentro del dominio de big data. La tendencia de hacer que los datos de los proyectos de investigación financiados por la publicación estén disponibles en Internet abre nuevas oportunidades para que las partes interesadas que se ocupan de la seguridad alimentaria aborden cuestiones que antes no eran posibles. Especialmente, el uso de teléfonos móviles y sistemas de trazabilidad avanzados en el monitoreo y el uso de redes sociales puede requerir herramientas e infraestructura que tengan más características de big data que lo que se tiene actualmente.