cvpartition
Partición de datos para validación cruzada
Descripción
cvpartition define una partición aleatoria en un conjunto de datos. Utilice esta partición para definir conjuntos de entrenamiento y prueba para validar un modelo estadístico mediante la validación cruzada. Utilice training para extraer los índices de entrenamiento y test para extraer los índices de prueba para la validación cruzada. Utilice repartition para definir una nueva partición aleatoria del mismo tipo que un objeto cvpartition dado.
Si especifica una variable de estratificación o agrupación cuando crea un objeto cvpartition, puede usar summary para mostrar más información sobre la división de los datos.
Creación
Sintaxis
Descripción
devuelve un objeto c = cvpartition(n,KFold=k)cvpartition c que define una partición aleatoria no estratificada para la validación cruzada de k particiones sobre n observaciones. La partición divide aleatoriamente las observaciones en k submuestras inconexas, o particiones, cada una de las cuales tiene aproximadamente el mismo número de observaciones.
devuelve un objeto c = cvpartition(n,KFold=k,GroupingVariables=groupingVariables)c que define una partición aleatoria para la validación cruzada de k particiones. La función garantiza que las observaciones con la misma combinación de etiquetas de grupos, según lo especificado por groupingVariables, están en la misma partición. (desde R2025a)
Cuando se especifica groupingVariables, cvpartition descarta las filas de observaciones correspondientes a valores faltantes en groupingVariables.
crea una partición aleatoria para la validación cruzada de c = cvpartition(stratvar,KFold=k)k particiones estratificada. Cada submuestra, o partición, tiene aproximadamente el mismo número de observaciones y contiene aproximadamente las mismas proporciones de clase que en stratvar.
Cuando se especifica stratvar como primer argumento de entrada, cvpartition descarta las filas de observaciones correspondientes a valores faltantes en stratvar.
devuelve un objeto c = cvpartition(stratvar,KFold=k,Stratify=stratifyOption)c que define una partición aleatoria para la validación cruzada de k particiones. Si especifica Stratify=false, cvpartition ignora la información de clase de stratvar y crea una partición aleatoria no estratificada. En caso contrario, la función aplica la estratificación de forma predeterminada.
divide de forma aleatoria las observaciones en un conjunto de entrenamiento y un conjunto de prueba o retención con estratificación usando la información de clase de c = cvpartition(stratvar,Holdout=p)stratvar. Tanto el conjunto de entrenamiento como el de prueba tienen aproximadamente las mismas proporciones de clase que en stratvar.
devuelve un objeto c = cvpartition(stratvar,Holdout=p,Stratify=stratifyOption)c que define una partición aleatoria en un conjunto de entrenamiento y un conjunto de prueba o retención. Si especifica Stratify=false, cvpartition crea una partición aleatoria no estratificada. En caso contrario, la función aplica la estratificación de forma predeterminada.
crea una partición aleatoria para la validación cruzada dejando una observación fuera sobre c = cvpartition(n,"Leaveout")n observaciones. La validación cruzada dejando una observación fuera es un caso especial de KFold en el que el número de particiones es igual al número de observaciones.
c = cvpartition( crea un objeto n,"Resubstitution")c que no realiza una partición de los datos. Tanto el conjunto de entrenamiento como el conjunto de prueba contienen todas las n observaciones originales.
Argumentos de entrada
Propiedades
Funciones del objeto
repartition | Repartition data for cross-validation |
summary | Summarize cross-validation partition with stratification or grouping variable |
test | Índices de prueba para la validación cruzada |
training | Índices de entrenamiento para la validación cruzada |
Ejemplos
Sugerencias
Si especifica
stratvarcomo primer argumento de entrada acvpartition, la función descarta las filas de observaciones correspondientes a valores faltantes enstratvar. De manera similar, si especifica una o más variables de agrupación usandogroupingVariables, la función descarta las filas de observaciones correspondientes a valores faltantes engroupingVariables.Si especifica
stratvarcomo primer argumento de entrada acvpartition, la función aplica la estratificación de forma predeterminada. Puede especificarStratify=falsepara crear una partición aleatoria no estratificada.Puede especificar
Stratify=truesolo cuando el primer argumento de entrada acvpartitionesstratvar.

