Entradas

Mostrando entradas de enero, 2024

6. Naive Bayes (Aprendizaje Supervisado)

Imagen
Naive Bayes (Aprendizaje Supervisado) Naive Bayes es un algoritmo de aprendizaje supervisado utilizado comúnmente en problemas de clasificación y análisis predictivo. Se basa en el teorema de Bayes, que describe la probabilidad condicional de un evento dado el conocimiento previo de otro evento relacionado. El teorema de Bayes es un concepto fundamental en la teoría de la probabilidad y el estadístico. Se utiliza para calcular la probabilidad de que ocurra un evento A dado que otro evento B ya ha ocurrido. Matemáticamente, se expresa así: � ( � ∣ � ) = � ( � ∣ � ) ⋅ � ( � ) � ( � ) P ( A ∣ B ) = P ( B ) P ( B ∣ A ) ⋅ P ( A ) ​ � ( � ∣ � ) P ( A ∣ B ) : Probabilidad de que ocurra el evento A dado que ha ocurrido el evento B. � ( � ∣ � ) P ( B ∣ A ) : Probabilidad de que ocurra el evento B dado que ha ocurrido el evento A. � ( � ) P ( A ) y � ( � ) P ( B ) : Probabilidades de que ocurran los eventos A y B, respectivamente. La característica "naive" (ingenua) del algoritmo pro...

5.1. Como entrenar un modelo de árbol de decisiones

Imagen
  Como entrenar un modelo de árbol de decisiones  Link de dataset en Google Colab de los códigos  Entrenar un árbol de decisiones implica seguir algunos pasos básicos utilizando una biblioteca como Scikit-learn en Python. Paso 1: Preparar tus datos Primero, necesitas tener tus datos en un formato adecuado. Supongamos que tienes un conjunto de datos llamado X que contiene tus características (atributos) y un vector y con las etiquetas o resultados que quieres predecir. Paso 2: Importar la clase del árbol de decisiones y dividir los datos Scikit-learn proporciona una implementación de árboles de decisiones. Importa la clase DecisionTreeClassifier para clasificación o DecisionTreeRegressor para regresión, dependiendo de tu problema. from sklearn.tree import DecisionTreeClassifier   # Para clasificación from sklearn.tree import DecisionTreeRegressor   # Para regresión from sklearn.model_selection import train_test_split # Supongamos que tienes tus datos en...