
Archivo de la categoría: Programación
Minería de Datos: ¿Qué es y para que sirve?
Internet es el más grande repositorio de hypertexto, donde se tienen enlaces, imágenes, videos, texto, documentos, etc. Es debido a esto que se ha incrementado la demanda en el desarrollo de aplicaciones que permitan mantener la información en orden y de rápido acceso; es decir, todo apunta a la necesidad de metodologías de análisis inteligente de datos.
Es así donde la Minería de Datos hace un intento de buscarle sentido al procesamiento de información que actualmente se tiene disponible en la nube. Pero, ¿qué es la minería de datos y para que me sirve? Trataré de explicarme de manera sencilla y resumida los principales conceptos de ésta área con la finalidad de que te intereses en el tema.
La minería de datos (Data Mining en inglés) es un área relativamente “nueva” y prometedora, se puede definir como el proceso de descubrir la información procesable de conjuntos enormes de datos, encontrando patrones y tendencias; puede hacer uso de estadística, Aprendizaje Automático (machine learning), Inteligencia Artificial y técnicas de visualización de datos.
Hay áreas que toman ventaja de los resultados de aplicar minería de datos a su información, como es el caso de la mercadotécnia, medicina, manufactura, química, economía, etc.
La idea principal es encontrar tendencias y patrones predictivos mediante el análisis de lo que ya tenemos y conocemos, por lo que la Minería de datos puede ser descriptiva (descubrir patrones interesantes o relaciones) o predictivas (clasificar nuevos datos).
Sus tareas más comunes son:
- Clasificación. Organiza un dato dentro de una de las clases categóricas predefinidas.
- Regresión. El propósito de este modelo es hacer corresponder un dato con un valor real de una variable.
- Clustering. Es la agrupación de registros, observaciones o clases de objetos similares. Por lo que un cluster es una colección de registros que tienen similitudes y son distintos a cualquier otro cluster.
- Generación de reglas. Se extraen o generan reglas de los datos, estas hacen referencia al descubrimiento de relaciones de asociación y dependencias funcionales entre los diferentes atributos.
- Resumen. En esta tarea se proporcionan una descripción compacta de un subconjunto de datos.
- Análisis de secuencias. Se generan patrones secuenciales, el objetivo es modelar los estados del proceso, extraer e informar de la desviación y tendencias en el tiempo.
En un siguiente post explicaré más acerca de estas tareas y cuales son sus ventajas
.
@silvercorp | Twitter
Silvercorp | Youtube
Call me maybe al estilo Star Wars
Tomado del muro de @dragon_obscuro
¡Soy mejor que la televisión!

@nochedeletras
Mario Bros interpretado con violín
Sin palabras
