
Exploraremos los tipos de datos: estructurados, semiestructurados y no estructurados. Analizaremos las diferencias entre ellos. También, examinaremos ejemplos de cada uno.
Datos Estructurados
Datos estructurados son datos organizados en un formato definido. Piensa en tablas con filas y columnas. Cada columna tiene un tipo de dato específico (número, texto, fecha).
Ejemplo: Una tabla de clientes. Cada fila representa un cliente. Las columnas podrían ser: ID de Cliente, Nombre, Apellido, Dirección, Ciudad, Código Postal.
Must Read
Para crear una tabla de clientes, primero identifica la información a guardar. Define las columnas necesarias (ID, Nombre, etc.). Asigna un tipo de dato a cada columna (entero para ID, texto para Nombre, etc.).
Luego, inserta los datos en la tabla. Cada fila representa un nuevo cliente. Asegúrate de que los datos coincidan con el tipo de la columna.
Las bases de datos relacionales (como MySQL, PostgreSQL) son ideales. Almacenan y gestionan datos estructurados eficientemente. SQL (Structured Query Language) se usa para consultar y manipular estos datos.

Datos Semiestructurados
Datos semiestructurados no tienen un esquema rígido como los datos estructurados. Tienen etiquetas o marcadores para organizar la información. Esto permite cierta flexibilidad en la estructura.
Ejemplo: Un documento XML o JSON. Estos formatos usan etiquetas para definir los elementos de datos. La estructura no es fija como una tabla, pero está organizada.
Para crear un documento JSON, define un objeto principal. Dentro del objeto, agrega pares clave-valor. Las claves son nombres descriptivos (por ejemplo, "nombre", "edad").

Los valores pueden ser datos simples (texto, número, booleano). También pueden ser otros objetos JSON o arreglos. Esto permite estructuras complejas y anidadas.
Los archivos XML utilizan etiquetas para delimitar los datos. Comienzas con una etiqueta de apertura (por ejemplo, `
JSON y XML son comunes para el intercambio de datos. Las APIs web a menudo usan estos formatos. Los datos semiestructurados ofrecen un equilibrio entre estructura y flexibilidad.

Datos No Estructurados
Datos no estructurados no tienen un formato predefinido. Son datos que no se ajustan a tablas o esquemas. Esto incluye texto, imágenes, audio y video.
Ejemplo: Un correo electrónico. Tiene un encabezado (remitente, destinatario, asunto) y un cuerpo con texto libre. También puede tener adjuntos (imágenes, documentos).
Otro ejemplo: Una publicación en redes sociales. Puede contener texto, imágenes, videos y enlaces. La estructura varía significativamente entre publicaciones.

Para trabajar con datos no estructurados, se necesitan técnicas especiales. El procesamiento del lenguaje natural (NLP) ayuda a analizar texto. La visión artificial procesa imágenes y videos.
Para analizar el sentimiento en un texto, puedes usar algoritmos de NLP. Estos algoritmos identifican palabras y frases que expresan emociones. Luego, asignan una puntuación de sentimiento al texto.
El almacenamiento de datos no estructurados a menudo usa NoSQL databases o data lakes. Estas soluciones son más flexibles que las bases de datos relacionales. Permiten almacenar grandes volúmenes de datos en diversos formatos.
Cada tipo de dato tiene sus propias ventajas y desventajas. La elección depende de las necesidades del proyecto. Comprender las diferencias es crucial para el manejo de datos.