Autor: Argimir Gil/ Centro Nacional de Teledetección Agrícola CENATEL- FIIIDT.
INTRODUCCIÓN
La gestión de datos contribuye a las organizaciones a identificar y resolver puntos críticos de orden interno y permitir una mejor experiencia de los conocimientos científicos y tecnológicos sujetos a posibles innovaciones. Ahora bien, el concepto es mayormente utilizado desde la experticia informática, pero es también una herramienta fundamental en el desarrollo de la actividad científico tecnológica (ACT) tanto de la Geomática como de otros campos de las ciencias.
En esta nota técnica daremos aportes para concebir una gestión de datos con perspectiva a la construcción de servicios tentativos a usuarias y usuarios de nuestros productos tecnológicos, y la posibilidad de ingresos propios.
LA GESTIÓN Y ARQUITECTURA DE LOS DATOS.
“Arquitectura de datos son los modelos, políticas, reglas y estándares que nos indican de qué manera tenemos que almacenar, organizar e integrar los datos que recoge una compañía con el objetivo de que sean aprovechables y útiles”. Artyco.com (2020)
Esto quiere decir que en función de los procesos y organigramas de cada centro de investigación o laboratorio, debe haber un flujo o arqueo de qué datos manejan y su respectivo almacenaje, además de los protocolos mediante los cuales debe ser preservado los respectivos datos, es decir, una estrategia de la gestión científica en función de un elemento tan vicioso de la ACT, los datos.
Es fundamental internalizar que el dato es el bastimento esencial de la ciencia y se retroalimenta de ellos para la generación de nuevo conocimiento y sirve de elemento para el desarrollo formal de la misma, no se puede hablar de ciencia sin datos y menos de conocimiento. Es como el teorema en el campo de electromagnética, la onda y la partícula, valiéndonos de una analogía, el conocimiento-ciencia, tiene esa dualidad, comportarse como: dato y comprensión.
La arquitectura del dato fomenta la sistematización que requieren los profesionales de la informática, para proporcionar soporte a los mismos (datos), además de facilitar los procesos de protocolos tanto para servidores y bases de datos.
La arquitectura de datos, lleva implícito la construcción de base de datos. En el campo de la Geomática, mucho de los productos que se generan están en: tablas, ráster y vectores asociados a los resultados de la ACT, ahora bien en el particular caso de las tablas de datos, deben fomentarse las construcciones de bases de datos y sistematizar en relación con la necesidad de preservar la rigurosidad científica los datos bajo las metodologías requeridas.
Tipificar la data de acuerdo con los parámetros y características es esencial, donde los más estandarizados se describen en la siguiente lista:
- Datos imágenes (definir las fuentes y características, “versiones”, de los ráster). Incluye mapas, imágenes satelitales, fotos, pictogramas y organigramas.
- Data documental, la relativa a informes, tesis, libros y otros documentos sistematizados asociados a las ACT. Algunos también tendrán atributos ráster, pero no debe confundirse con dicha data. Posiblemente a nivel informático tenga un tratamiento similar, pero no la misma salida o trato como vista usuario.
- Bases de Datos, datos crudos incluyen toda fuente vinculada a matrices y plataformas de hojas de cálculo sujetas o no a la base de datos.
- Metadatos asociados. Información metodológica, autoría e información marginal que explican los datos. En Geomática es esencial y es la debilidad sistémica más resaltante de la ACT. El metadato responde a las preguntas: ¿cómo? ¿Quién? y ¿bajo qué características están construidos los datos?, por nombrar las interrogantes más generales.
La arquitectura de datos no es un elemento fijo, sino que debe gestionarse, mejorarse y auditarse continuamente y debe estar en una adaptación planificada. De acuerdo con las características de los datos, la institucionalidad debe establecer los periodos para mejora y revisión, además de diseñar una estrategia de actualización tecnológica en torno a los mismos.
No se debe confundir la construcción de bases de datos, que puede ser un proceso ya construido o en vías de construir, con la gestión de datos, y su arquitectura. Se puede tener bases de datos y no tener una gestión de datos, así como tener una arquitectura concebida y no una base de datos funcional.
INGRESOS PROPIOS A PARTIR DE LA GESTIÓN DE DATOS
El concepto de Infraestructura de Datos Espaciales (IDE), involucra y simplifica los productos sujetos a comercialización, entre los cuales están los datos. La Fundación Instituto de Ingeniería para Investigación y Desarrollo Tecnológico (FIIIDT) en sus treinta y ocho (38) años de quehacer científico tecnológico, tiene un acervo de conocimiento muy importante de ámbito nacional, sumado a que el centro de investigación pionero, en el campo de la Geomática, Centro de Procesamiento Digital de Imágenes (CPDI) resguarda datos valiosos e irrepetibles de dicho constructo. Se podría listar otros espacios como el Centro de Tecnología de Materiales (CTM), así como el Centro de Ingeniería Mecánica y Diseño Industrial (CIMECDI) entre otros, todos y cada uno tienen, en primera instancia, datos que pueden ser útiles para generar ingresos propios, sólo requiere establecer un plan de gestión de los mismos identificando: ¿qué puede comercializarse?, además de definir los usuarios interesados.
Datos-Información-Conocimiento-Sabiduría (jerarquía DICS)
Es importante proponer que los usuarios académicos, no asociados a la institución, podrían acceder a dichos datos a partir de la presentación de justificaciones académicas y además con un compromiso de entrega de los datos y documentos finales a su investigación. Además de presentar en los trabajos la debida identificación de autoría y usos de los datos de la institución. Con esto se garantizan nuevos datos y construcción de nuevo conocimiento (red de conocimiento).
Ahora bien, la forma de comercializar los datos, tomando el ejemplo en el campo geológico minero, es bajo los parámetros de DATAPACK (1). Es necesario definir una unidad de gestión que divulgue y comercialice el DATAPACK como fuente primordial para el acompañamiento científico de las políticas públicas y / o proyectos públicos-privados y además el ámbito académico.
IDEAS FUERZA
- En muchos casos las instituciones se centran en construcciones de bases de datos, dejando a un lado la gestión, como proceso estratégico de los mismos.
- Suele ocurrir que la gestión de datos solo es perspectiva de las oficinas o gerencias de Tecnología de Información, como se muestra es una responsabilidad compartida y sirve de bastimento transversal a toda la institucionalidad, y con mayor preponderancia en la Ciencia Tecnología e Innovación (CTI).
- En la mayoría de las instituciones CTI, los datos son manejados bajo servidores o nube, en pocos casos se establece resguardo solo en estaciones personales de trabajo de cada investigador, además de que los respaldos, que pudieran tenerse de cada estación de trabajo de uso de los investigadores, es un proceso automático con un periodo definido.
- Los procesos de red deben auditar los datos, en muchos casos no hay restricciones sino monitoreo y alerta (internet), tanto al usuario investigador y al administrador institucional.
- Los puertos y respaldos son bajo plataforma servidor y nube. Para todo debe crearse un protocolo.
- Gestión de datos no necesariamente implica una restricción en los usuarios institucionales, sobre todo involucra una identificación efectiva de posibles fuentes de distorsión o enajenamiento de los datos.
- Existen procesos que requieren una sistematización exhaustiva, donde la institucionalidad debe velar por contar con profesionales de archivo y clasificación. No solo se debe contar con la perspectiva de experiencia de otras profesiones que tengan competencia en la gestión de datos, hay numerosos casos donde se falla en elementos que luego son transcendentales en la gestión de datos, de no contar con las experticias respectivas.
REFERENCIA Y BIBLIOGRAFÍA
- Artyco.com (2020) https://artyco.com/que-es-la-arquitectura-de datos/#:~:text=Arquitectura%20de%20datos%20son%20los,que%20sean%20aprovechables%20y%20%C3%BAtiles. Consultado el 06 de Octubre de 2020
- Miguel Ángel Bernabé Poveda y Carlos Manuel López Vázquez (2012). Fundamentos de las Infraestructuras de Datos Espaciales. SERIE CIENTÍFICA UPM Press, 596 pág. (17 x 24 cms). Editado y publicado por UPM Press, 1a edición, año 2012. Impreso en España por Ulzama Digital. www.ulzama.com
- Francisco-Javier García-Marco (2011) La pirámide de la información revisitada: enriqueciendo el modelo desde la ciencia cognitiva. Universidad de Zaragoza Facultad de Filosofía y Letras Pedro Cerbuna, 12. 50009 Zaragoza jgarcia@unizar.es
(1) Un DATAPACK (Paquete de Datos) es un conjunto de datos pre estructurados que puede alimentar a distintos software, para enseñar y entregar información y productos, que luego puede inquirir. En otras palabras, un paquete de datos se puede utilizar para alimentar actualizaciones menores a un sistema. Los paquetes de datos están diseñados para clientes que tienen bases de datos o sistemas de análisis existentes, por ejemplo, Autodesk, Matlab, sistemas de información geográfica u otros sistemas de cartografía y tabulación entre otros. Censo. Oficina de Estadísticas de Australia. Consultado el 7 de Octubre de 2020.
Contacto: agil@fii.gob.veargimir.gil@gmail.com