Apartado 2 - Principales Técnicas y Algoritmos de IA

🎯 Resumen Ejecutivo

Las técnicas y algoritmos de inteligencia artificial constituyen el arsenal fundamental mediante el cual se construyen sistemas inteligentes capaces de percibir, razonar, aprender y actuar. Este apartado examina la evolución desde algoritmos clásicos hasta arquitecturas de aprendizaje profundo de vanguardia. Los paradigmas de aprendizaje incluyen supervisado (aprendizaje de ejemplos etiquetados), no supervisado (descubrimiento de patrones sin etiquetas), por refuerzo (aprendizaje mediante prueba y error con recompensas), y semi-supervisado (combinación de datos etiquetados y no etiquetados). Los algoritmos clásicos como árboles de decisión, máquinas de vectores de soporte (SVM) y k-vecinos más cercanos establecieron fundamentos sólidos. Las redes neuronales artificiales, inspiradas en el cerebro humano, evolucionaron desde el perceptrón simple hasta arquitecturas profundas sofisticadas. Las redes convolucionales revolucionaron visión por computadora, las recurrentes procesaron secuencias temporales, y los transformers con mecanismos de atención dominan actualmente el procesamiento de lenguaje natural. Las técnicas de optimización como descenso de gradiente estocástico (SGD) y Adam, junto con métodos de regularización como dropout y batch normalization, son esenciales para entrenar modelos efectivos.

📖 Contenido Principal

📊 Fundamentos del Aprendizaje Automático

El aprendizaje automático permite a sistemas mejorar su rendimiento mediante experiencia, sin ser programados explícitamente para cada tarea. Los paradigmas fundamentales incluyen: Aprendizaje Supervisado donde el sistema aprende de ejemplos etiquetados, mapeando entradas a salidas conocidas, aplicable en clasificación (categorizar datos en clases discretas) y regresión (predecir valores continuos). Aprendizaje No Supervisado donde el sistema descubre patrones en datos no etiquetados, incluyendo clustering para agrupar datos similares y reducción de dimensionalidad para comprimir información preservando estructura esencial. Aprendizaje por Refuerzo donde un agente aprende políticas de comportamiento mediante interacción con entorno, recibiendo recompensas o penalizaciones. Aprendizaje Semi-Supervisado que combina pequeñas cantidades de datos etiquetados con grandes cantidades no etiquetados. La elección del paradigma depende de disponibilidad de etiquetas, naturaleza del problema, y objetivos específicos.

🌳 Algoritmos Clásicos de Aprendizaje Automático

Los árboles de decisión construyen modelos mediante particiones recursivas del espacio de características, creando estructuras jerárquicas interpretables. Los métodos de ensamble como Random Forest combinan múltiples árboles para mejorar precisión y robustez, mientras que Gradient Boosting construye modelos aditivos secuencialmente, corrigiendo errores de iteraciones previas. XGBoost y LightGBM son implementaciones altamente optimizadas ampliamente usadas en competiciones de machine learning. Las Máquinas de Vectores de Soporte (SVM) encuentran hiperplanos óptimos que separan clases con margen máximo en espacios de alta dimensión, utilizando el "truco del kernel" para manejar separaciones no lineales. K-Vecinos Más Cercanos (k-NN) clasifica instancias basándose en mayoría de votos de vecinos más cercanos en espacio de características, siendo simple pero efectivo, aunque computacionalmente costoso en predicción con datasets grandes. Naive Bayes aplica teorema de Bayes con suposiciones de independencia, siendo sorprendentemente efectivo en clasificación de texto y filtrado de spam.

🧠 Redes Neuronales Artificiales

Las redes neuronales artificiales, inspiradas en el cerebro humano, consisten en capas de neuronas artificiales interconectadas. El Perceptrón simple, propuesto por Rosenblatt (1958), es un clasificador lineal que aprende mediante ajuste de pesos. Las redes neuronales feedforward multicapa (Multi-Layer Perceptrons) con funciones de activación no lineales pueden aproximar cualquier función continua (teorema de aproximación universal). El algoritmo de retropropagación calcula gradientes eficientemente mediante regla de la cadena, permitiendo entrenar redes profundas. Las funciones de activación como ReLU (Rectified Linear Unit), Sigmoid y Tanh introducen no linealidades cruciales. Las Redes Neuronales Convolucionales (CNNs) incorporan conectividad local, compartición de pesos y pooling, siendo altamente efectivas para datos con estructura de grilla como imágenes. Arquitecturas como LeNet, AlexNet, VGG, ResNet con conexiones residuales, e Inception con módulos paralelos han progresivamente mejorado rendimiento en visión por computadora. Las Redes Neuronales Recurrentes (RNNs) procesan secuencias mediante conexiones recurrentes que mantienen estado oculto, aunque sufren de gradientes desvanecientes en secuencias largas. LSTM (Long Short-Term Memory) y GRU (Gated Recurrent Units) mitigan este problema mediante arquitecturas de compuerta que controlan flujo de información.

🔄 Aprendizaje Profundo Avanzado

Las arquitecturas Transformer, introducidas por Vaswani et al. (2017), revolucionaron procesamiento de lenguaje natural mediante mecanismos de auto-atención que permiten modelar dependencias de largo alcance sin recurrencia. La atención multi-cabeza procesa información en paralelo desde diferentes subespacios de representación. BERT (Bidirectional Encoder Representations from Transformers) introdujo pre-entrenamiento bidireccional mediante masked language modeling, mientras que GPT (Generative Pre-trained Transformer) utiliza autoregresión unidireccional. Los modelos de lenguaje de gran escala como GPT-3 (175 mil millones de parámetros) exhiben capacidades emergentes sorprendentes. Las Redes Generativas Adversarias (GANs) consisten en dos redes neuronales -generador y discriminador- compitiendo en juego minimax, produciendo muestras sintéticas indistinguibles de datos reales. Aplicaciones incluyen generación de imágenes, síntesis de video, y aumento de datos. Los Autoencoders aprenden representaciones comprimidas mediante arquitectura encoder-decoder, útiles para reducción de dimensionalidad y detección de anomalías. Los Variational Autoencoders (VAEs) aprenden distribuciones latentes probabilísticas permitiendo generación controlada.

�?Técnicas de Optimización y Regularización

La optimización busca minimizar funciones de pérdida ajustando parámetros del modelo. El Descenso de Gradiente calcula gradiente de pérdida respecto a parámetros y actualiza en dirección opuesta. El Descenso de Gradiente Estocástico (SGD) usa mini-lotes aleatorios, siendo computacionalmente eficiente. Métodos adaptativos como Adam, RMSprop y AdaGrad ajustan tasas de aprendizaje individualmente por parámetro. La regularización previene sobreajuste añadiendo penalizaciones o introduciendo aleatoriedad. La regularización L1 (Lasso) induce esparsidad, mientras L2 (Ridge) penaliza magnitud de pesos. Dropout desactiva aleatoriamente neuronas durante entrenamiento, forzando robustez. Batch Normalization normaliza activaciones de cada capa, estabilizando y acelerando entrenamiento. Early Stopping monitoriza rendimiento en conjunto de validación, deteniendo entrenamiento cuando comienza sobreajuste. Data Augmentation genera variaciones sintéticas de datos de entrenamiento mediante transformaciones, mejorando generalización especialmente en visión por computadora.

🎮 Aprendizaje por Refuerzo

El aprendizaje por refuerzo modela agentes que aprenden políticas de comportamiento mediante interacción con entornos, recibiendo recompensas. Los Procesos de Decisión de Markov (MDPs) formalizan el problema: conjunto de estados, acciones, función de transición probabilística, función de recompensa, y factor de descuento. El objetivo es encontrar política óptima que maximiza recompensa acumulada esperada. Q-Learning es algoritmo off-policy que aprende función de valor-acción óptima mediante actualizaciones iterativas. SARSA es variante on-policy que actualiza basándose en acciones tomadas por política actual. Policy Gradient optimiza directamente parámetros de política mediante ascenso de gradiente en recompensa esperada. El Deep Reinforcement Learning combina aprendizaje por refuerzo con aproximación de funciones mediante redes neuronales profundas. DQN (Deep Q-Network) estabiliza entrenamiento mediante experience replay y redes objetivo separadas. Actor-Critic combina estimación de función de valor (crítico) con optimización de política (actor). PPO (Proximal Policy Optimization) y A3C (Asynchronous Advantage Actor-Critic) son métodos modernos robustos. AlphaZero combina búsqueda de árbol Monte Carlo con redes neuronales profundas, logrando rendimiento superhuman en Go, ajedrez y shogi mediante auto-juego puro.

⚙️ Apartado 2

🎯 Resumen Ejecutivo

📖 Contenido Principal

📊 Fundamentos del Aprendizaje Automático

🌳 Algoritmos Clásicos de Aprendizaje Automático

🧠 Redes Neuronales Artificiales

🔄 Aprendizaje Profundo Avanzado

�?Técnicas de Optimización y Regularización

🎮 Aprendizaje por Refuerzo

📝 Test de Conocimientos - Apartado 2

1. ¿Qué paradigma de aprendizaje automático utiliza datos sin etiquetas para descubrir patrones?

2. ¿Qué técnica permite a las CNNs ser efectivas en visión por computadora?

3. ¿Qué innovación introdujeron las arquitecturas Transformer?

4. ¿Qué técnica de regularización desactiva aleatoriamente neuronas durante el entrenamiento?

5. ¿Qué componentes compiten en las Redes Generativas Adversarias (GANs)?

Resultados del Test