10. Design of a classifier Samples for training Values of variables (xi) Classes Pertaining to samples Learning System Classifier type Classifier for Specific application Case Variables (Features) Classes
11. Estimating the execution of a learning system What is an error? Reason for error (estimate) = number of errors number of cases Class (+) Class (-) Classification (+) Correct (+/+) Error (-/+) Classification (-) Error (+/-) Correct (-/-)
12. Apparent and true error Classifier Samples for training Apparent reason for error New cases True error
13. Error estimation using samples for training and samples for testing Cases for training the classifier Cases for testing the classifier Samples
14. Example: 1-d Class 1: n 1 = 5 X 1 Train Y 1 Train Class 2: n 1 = 5 X 2 Train Y 2 Test
X1 y X2 son observaciones (features) llamados tambien atributos o variables. “ +” -> clase 1 “ -” -> clase 2 Learning es el proceso de generalizar los patrones de las clases a partir de las observaciones previamente clasificadas
El fundamento del sistema de aprendizaje es extraer una regla de decision de unas muestras para aplicarlo a una nueva data. Un tipico sistema de aprendizaje puede ser un arbol de decision, una funcion discriminante (Pattern Recognition) o un neural network. El sistema de aprendizaje tiene un conjunto de muestras finitas que se saben a que clase pertenecen. Se escoge la estructura o tipo de clasificador a usarse. El clasificador tiene que a partir de su estructura y de las muestras previamente clasificadas, relacionar las muestras observadas a distintos patrones que representan clases.
Luego de que el clasificador ha sido entrenado con muestras previamente clasificadas el clasificador podra clasificar datos nuevas en distintas clases.
Ejemplo : Dos clases Clase “+” y clase “-”
La razon de error aparente esta parcializado. Es optimista. La razon de error verdadera (casos nuevos) es mas objetivo. En la medida que el numeros de casos nuevos sea grande el estimado de error de casos nuevos se acercara al verdadero error. Como estimar la razon de error verdadera (necesitamos muestras que conozcamos a que clase pertenece)?
Las muestras de entrenamiento serviran para inducir reglas de clasificacion en el tipo de clasificador usado. Tambien se usa para estimar la razon de error aparente. Las muestras de prueba (independiente de las de entrenamiento) se usaran para estimar la razonde error verdadera.