Revista Farmespaña Industrial - Especial Calidad 2025

(COU). Se deberá ajustar según el nivel de riesgo del modelo y las actividades necesa- rias para garantizar su fiabilidad. Debe incluir la información de los pasos previos: pregunta de interés, contexto de uso y evaluación del riesgo del modelo. Para mo- delos de bajo riesgo, el plan puede ser más simple; para modelos de alto riesgo, debe ser detallado y riguroso. Descripción del modelo El plan de evaluación de credibilidad debe incluir una descripción detallada del modelo de IA, comenzando por los inputs y outputs que utiliza y genera. Los inputs hacen refe- rencia a los datos que alimentan el modelo, mientras que los outputs son los resultados específicos que se producen para responder a la pregunta de interés. Además, es crucial detallar la arquitectura del modelo, como el uso de redes neurona- les convolucionales u otras estructuras, así como los parámetros internos (hiperpará- metros) que influyen en su funcionamiento, como pesos, tasas de aprendizaje o funcio- nes de pérdida. También se debe explicar el proceso de se- lección de características utilizadas en el modelo, asegurando que estas sean relevan- tes y representativas para el contexto de uso, así como las funciones de pérdidas usadas para medir el error en las predicciones y así poder optimizarlo. Otro aspecto esencial es justificar el en- foque metodológico elegido para el desa- rrollo del modelo. Esto podría incluir explicar por qué se optó por una metodología espe- cífica (p.ej ., supervisado, no supervisado) y concluye cómo esta se ajusta al problema que el modelo busca resolver. Además, el plan debe incluir cualquier decisión técnica tomada durante el diseño, como la elección de algoritmos y estra- tegias de optimización, asegurando que estas decisiones estén alineadas con los re- quisitos del contexto regulatorio y operativo. Esta descripción detallada garantiza trans- parencia en el desarrollo del modelo, facili- tando su validación y aceptación regulatoria. Descripción de los Datos Los datos de entrenamiento y ajuste son fun- damentales para el desempeño y credibili- dad de unmodelo de IA. Estos datos incluyen información utilizada para enseñar al mode- lo cómo realizar predicciones y para optimi- zar sus parámetros internos. Por ello su ori- gen, adquisición, procesado, y segregación en grupos es uno de los puntos diferenciales respecto a los modelos convencionales Para la Adquisición de estos datos, se debe asegurar que sean representativos del problema que se busca resolver. Para que los datos sean relevantes y confia- bles, es esencial que sean precisos, com- pletos y trazables. Esto significa que los datos deben reflejar las condiciones reales del contexto de uso, contener la suficiente variedad para representar todos los escenarios posibles, y tener un histo- rial claro que permita rastrear su origen y transformaciones. Los datos deben ser procesados para garantizar su calidad, lo que incluye la eli- minación de valores erróneos (limpieza) y la eliminación de duplicados entre otros, la normalización de escalas (transformación). Además, el anexo D11 de las GAMP5 incluye dentro del procesado de datos las acciones de: Perfilar (ej. formatear), Limpiar valores incorrectos, transformar (ej. homogeneizar unidades), Anonimizar (para GDPR [79]/pri- vacidad de la UE) y aumentar para diversifi- car los datos. Dentro del procesado de datos, el etique- tado es otro paso crítico, ya que define los grupos o resultados esperados que el mode- lo debe aprender a predecir, en especial en modelos con aprendizaje supervisado. También debe indicarse si el origen de los datos es centralizado o si se utilizó un enfo- que de federated learning , y detallar qué ac- tividades de desarrollo del modelo se reali- zaron con cada conjunto de datos, así como la separación de los conjuntos de entrena- miento y evaluación. En resumen, para garantizar que los datos de desarrollo sean adecuados para el con- texto de uso (COU), es esencial que sean relevantes y representativos del entorno en el que se aplicará el modelo. Esto implica que los datos deben incluir elementos clave, contar con un número suficiente de mues- tras y reflejar con precisión el proceso de fa- bricación o el sistema que el modelo busca optimizar. Además, la fiabilidad de los da- tos debe asegurarse mediante su precisión, completitud y trazabilidad, permitiendo que cualquier transformación o uso en el desarrollo del modelo pueda ser verificado. También es importante documentar qué actividades específicas del desarrollo del modelo se realizaron con cada conjunto de datos, como entrenamiento, ajuste y valida- ción, asegurando que su uso sea coherente con los objetivos del modelo y su contexto regulado. Descripción del entrenamiento El entrenamiento del modelo de IA y el ajus- te de hiper parámetros es un proceso clave para su desarrollo y evaluación, en el que se ajustan sus parámetros para aprender patro- nes a partir de los datos. Existen diferentes metodologías de aprendizaje que pueden aplicarse según el tipo de problema. En el aprendizaje supervisado, el modelo se entrena con datos etiquetados, lo que significa que conoce de antemano los resul- tados esperados y ajusta sus predicciones en consecuencia. En contraste, el aprendi- zaje no supervisado se emplea cuando no se cuenta con etiquetas y el modelo debe descubrir estructuras ocultas en los datos, como segmentar lotes de producción con características similares sin una clasificación predefinida. Aunque hay muchos otros tipos de entrenamiento. Para evaluar el entrenamiento, se utilizan diversas métricas de desempeño que se de- tallan más adelante, las cuales permiten me- dir la precisión del modelo en su contexto de uso. Entre ellas, la curva ROC (Receiver Ope- rating Characteristic) y el área bajo la curva (AUC) ayudan a evaluar el equilibrio entre verdaderos positivos y falsos positivos. Otras métricas, como la sensibilidad (capacidad del modelo para detectar correctamente los casos positivos) y la especificidad (habilidad para descartar correctamente los casos ne- gativos), son esenciales en aplicaciones críti- cas, como la clasificación. Dependiendo del propósito del modelo, diferentes combina- ciones de métricas pueden ser más relevan- tes para garantizar su desempeño óptimo en escenarios reales. Uno de los desafíos principales en el en- trenamiento del modelo es evitar el infra/ sobreajuste (under/overfitting), que ocu- rre cuando el modelo no generaliza bien (infrajuste) o memoriza los datos de entre- namiento en lugar de generalizar patrones aplicables a nuevos datos. Para mitigar este problema, se aplican técnicas como la regu- larización, que introduce penalizaciones en el proceso de optimización para evitar que el modelo se ajuste excesivamente a los datos de entrenamiento. ACTUALIZACIÓN REGULATORIA 44 FARMESPAÑA INDUSTRIAL · ESPECIAL CALIDAD EN LA INDUSTRIA FARMACÉUTICA

RkJQdWJsaXNoZXIy OTAxNDYw