Datos estructurados (Structured Data)
Los datos estructurados tienen perfectamente definido la longitud, el formato y el tamaño de sus datos.
Se almacenan en formato tabla, hojas de cálculo o en bases de datos relacionales.
Datos no estructurados (Unstructured Data)
Los datos no estructurados se caracterizan por no tener un formato específico.
Se almacenan en múltiples formatos como documentos PDF o Word, correos electrónicos, ficheros multimedia de imagen, audio o video,…
Datos semiestructurados (Semistructured Data)
Los datos estructurados son una mezcla de los dos anteriores no presenta una estructura perfectamente definida como los datos estructurados pero si presentan una organización definida en sus metadatos donde describen los objetos y sus relaciones, y que en algunos casos están aceptados por convención, como por ejemplo los formatos HTML, XML o JSON.
Genial, es la primera página que lo explica en español, o sea para cualquier persona ajena a los que conocen este tema
buenas tardes quisiera que me colaboraran estoy en un curso básico de big data la verdad no tengo conocimiento de esto y me dejaron una tarea la cual quisiera me ayudaran En el contexto de su trabajo, estudio o en su comunidad, ¿cuáles serían datos estructurados, ¿cuáles semi estructurados y cuáles datos no estructurados?
buenos dias :
me pueden ayudar con esta pregunta gracias
En el contexto de su trabajo, estudio o en su comunidad, ¿cuáles serían datos estructurados, ¿cuáles semi estructurados y cuáles datos no estructurados?
El post responde precisamente a esa pregunta, lee con atención en que se diferencia cada tipo y luego aplicalo a tú entorno de trabajo, estudio o comunidad.
Así da gusto aprender
De las pocas explicaciones en informática claras y breves
Una fe de erratas:
En el subtitulo : «Datos semiestructurados (Semistructured Data)»
Continua diciendo
«Los datos estructurados son» debia ser «semiestruturados»
¿Por qué no se ha aclarado este punto?
Esto a dado lugar a muchas confusiones: Se debería haber puesto «semiestructurados».
Dentro de los datos semiestructurados se encuentran tambien los registros de longitud multiple, una tecnica utilizada con lenguajes de tipo COBOL para manipular volumenes grandes de informacion
Hola, me gustaría aprender más sobre datos no estructurados y semistructurados, el aprendizaje va enofocado a como tratar estos datos para sacar el mejor provecho, podrían dedicar un artículo enfocado a cómo trabajarlos, algo sencillpo en R, o me pueden recomendar algún curso para comenzar mi aprendizaje sobre este tipo de datos. La finalidad es para trabajar con comentarios que dejan personas vía mensaje y no tienen estructura ya que al extraer la información se registran los comentarios, fechas, correos, etc. en un sólo campo, y quisiera trabajar con estos datos.
Excelente día y gracias.
P. D. Gracias por sus artículos, en lo personal me ayudan mucho.