Modelo Predictivo De Duración De Periodos De Incapacidad Temporal

   EMBED

Share

Preview only show first 6 pages with water mark for full document please download

Transcript

TESIS DOCTORAL MODELO PREDICTIVO DE DURACIÓN DE PERIODOS DE INCAPACIDAD TEMPORAL EN LA ENFERMEDAD COMÚN César González Ramírez Departamento de Terapéutica Médico-Quirúrgica 2015 1 TESIS DOCTORAL MODELO PREDICTIVO DE DURACIÓN DE PERIODOS DE INCAPACIDAD TEMPORAL EN LA ENFERMEDAD COMÚN César González Ramírez Departamento de Terapéutica Médico-Quirúrgica Conformidad de los Directores Fdo: Diego Peral Pacheco Fdo: Jesús Montanero Fernández 2015 2 ÍNDICE LISTA DE TABLAS ......................................................................................... 5 LISTA DE GRÁFICOS .................................................................................... 7 LISTA DE ABREVIATURAS ........................................................................... 8 1. INTRODUCCIÓN ....................................................................................... 10 1.1. Incapacidad Temporal ......................................................................... 14 2. OBJETIVOS............................................................................................... 21 3. MATERIAL Y MÉTODOS .......................................................................... 22 3.1. Consideraciones previas sobre los datos ............................................ 22 3.2. Variables a considerar y modelo predictivo ......................................... 27 3.2.1. Modelo Lineal y selección de las fuentes de variabilidad a contemplar en lo sucesivo ......................................................................... 27 3.2.2. Estudio comparativo de los diferentes modelos de predicción ..... 34 3.2.2.1. Modelo Lineal ............................................................................ 34 3.2.2.2. Árbol de regresión ..................................................................... 36 3.2.2.3. Modelo de regresión gamma ..................................................... 37 3.2.2.4. Modelo de predicción categórica ............................................... 40 3.2.2.4.1. Categorización de pronósticos lineal y gamma ......................... 40 3.2.2.4.2. Regresión logística binaria ........................................................ 41 3.2.2.4.3. Árbol de decisión ....................................................................... 41 3.2.2.4.4. Método mixto lineal-gamma ...................................................... 44 3.2.2.4.5. Predicción con tres categorías .................................................. 45 3.2.3. Conclusión: modelo predictivo a considerar y variables de interés 46 4. RESULTADOS .......................................................................................... 49 4.1. Diagnóstico ......................................................................................... 50 4.2. Cuenta................................................................................................. 52 4.3. Pago .................................................................................................... 53 4.4. Ocupación ........................................................................................... 54 4.5. Edad .................................................................................................... 56 4.6. Codiagnóstico ..................................................................................... 58 4.7. Hijos .................................................................................................... 59 4.8. Provincia ............................................................................................. 61 3 4.9. Tipo de contrato .................................................................................. 63 4.10. Recaída............................................................................................ 64 4.11. Estado civil ....................................................................................... 65 4.12. Interacción diagnóstico - sexo.......................................................... 66 4.13. Interacción diagnóstico - tipo de pago ............................................. 68 4.14. Interacción Número episodio - hábito tabáquico .............................. 72 5. DISCUSIÓN ............................................................................................... 74 6. CONCLUSIONES ...................................................................................... 85 7. BIBLIOGRAFIA .......................................................................................... 88 8. ANEXOS .................................................................................................... 93 ANEXO I. Documento de autorización de Ibermutuamur para el análisis de los datos........................................................................................................ 94 ANEXO II. Distribución de diagnósticos por epígrafe .................................... 99 ANEXO III. Algoritmo del árbol de decisión del modelo .............................. 100 4 LISTA DE TABLAS Tabla 3.1: Prueba Anova de los efectos de las variables Tabla 3.2: Comparativa de los errores cometidos por los modelos lineal, gamma y mixto. Tabla 3.3: Resultados de la categorización de los pronósticos de los modelos lineal y gamma Tabla 3.4: Sensibilidad del punto de corte 80 días en árbol de decisión Tabla 3.5: Sintaxis SPSS del algoritmo de decisión Tabla 4.1: Distribución de las frecuencias de los tramos de duración de los procesos Tabla 4.2: Distribución de las frecuencias de los diagnósticos de los procesos Tabla 4.3: Distribución de la duración de los procesos según diagnóstico Tabla 4.4: Distribución de la duración de los procesos según la cuenta Tabla 4.5: Distribución de la duración de los diagnósticos según la cuenta Tabla 4.6: Distribución de la duración de los diagnósticos según el tipo de pago Tabla 4.7: Distribución de la duración de los diagnósticos según ocupación (I) Tabla 4.8: Distribución de la duración de los diagnósticos según ocupación (II) Tabla 4.9: Distribución de la duración de los procesos según el tramo de edad Tabla 4.10: Distribución de la duración de los diagnósticos según el tramo de edad Tabla 4.11: Evolución de la frecuencia de los tramos de edad en el periodo 2008-2012 Tabla 4.12: Distribución de la duración de los procesos según el codiagnóstico Tabla 4.13: Distribución de la duración de los procesos según la descendencia 5 Tabla 4.14: Distribución de la duración de los diagnósticos según la descendencia Tabla 4.15: Distribución de la duración de los procesos según la provincia de origen Tabla 4.16: Distribución de la frecuencia de los tramos de duración según la provincia de origen Tabla 4.17: Distribución de la duración de los procesos según el tipo de contrato Tabla 4.18: Distribución de la duración de los diagnósticos según el tipo de contrato Tabla 4.19: Distribución de la duración de los procesos según la recaída Tabla 4.20: Distribución de la duración de los procesos según el estado civil Tabla 4.21: Distribución de la duración de los procesos según el sexo Tabla 4.22: Distribución de la frecuencia de los tramos de duración según el sexo Tabla 4.23: Distribución del genero según el tramo de edad Tabla 4.24: Distribución de la frecuencia de los diagnósticos según el sexo Tabla 4.25: Distribución de la duración de los diagnósticos según el tipo de Pago Tabla 4.26: Distribución de la frecuencia de los diagnósticos según el tipo de Pago Tabla 4.27: Distribución de la duración de los diagnósticos según el hábito tabáquico Tabla 4.28: Distribución de la duración de los procesos en función del número de episodio y del hábito tabáquico 6 LISTA DE GRÁFICOS Gráfico 1.1: Relación entre el gasto de IT del Sistema y el PIB en el periodo 2007-2012 Gráfico 1.2: Duraciones medias de los periodos de IT del INSS, ISM y MUCOSS en el periodo 2007-2012 Gráfico 1.3: Tiempos que influyen en el coste de los procesos de IT Gráfico 3.1: Distribución de las duraciones de los procesos según su frecuencia Gráfico 3.2: Análisis de los residuos del modelo Gráfico 3.3: Diagrama de dispersión de los residuos frente a los valores ajustados Gráfico 3.4: Diagrama de dispersión de los valores ajustados frente a los valores del logaritmo Gráfico 3.5: Histograma de los errores del pronóstico final Gráfico 3.6: Diagrama de dispersión de los valores predichos frente a los reales Gráfico 3.7: Distribución de los residuos brutos Gráfico 3.8: Histograma de los valores pronosticados frente a los reales Gráfico 3.9: Importancia normalizada de las variables del modelo Gráfico 4.1: Duraciones medias de los diagnósticos según la ocupación Gráfico 4.2: Duraciones medias de los diagnósticos según la presencia de codiagnóstico Gráfico 4.3: Distribución de los tramos de duración de los procesos según el tipo de Pago 7 LISTA DE ABREVIATURAS CNO 04: Clasificación Nacional de Ocupaciones IT: Incapacidad temporal INSS: Instituto Nacional de la Seguridad Social ISM: Instituto Social de la Marina LGSS: Ley General de la Seguridad Social MCP: Mínimos Cuadrados Ponderados MUCOSS: Mutuas colaboradoras con la Seguridad Social PIB: Producto Interior Bruto 8 AGRADECIMIENTOS A mi padre, Manolo, y mi madre, Ana, por haberme transmitido los valores fundamentales de la vida y la importancia del esfuerzo y la dedicación para conseguir metas y objetivos. A mi mujer, Carmen, y mi hija, Aitana, por lo que son y lo que representan. A mis directores de Tesis por su ayuda y colaboración incondicional. A mi amigo Rafael por apoyarme en mis inquietudes investigadoras. 9 1. INTRODUCCIÓN El concepto Incapacidad/Discapacidad está presente en la evolución del hombre a lo largo de su historia. Desde la Prehistoria (edad de piedra y edad de los metales) en la que la forma oral era la manera de pasar las tradiciones, enseñanzas y sucesos, tenemos constancia a través de estudios antropológicos de la existencia de personas discapacitadas y de instrumentos por ellas utilizadas. En la “sima de los huesos” de Atapuerca se han encontrado restos de más de 30 individuos que vivieron hace 300.000 años1 . Uno de estos antepasados, el Homo Hedilbergensis, presentaba un crecimiento anormal de sus huesos que le afectaba al conducto auditivo y, a consecuencia de esta patología, se deduce que la sordera era casi inevitable. Por tanto, puede que este individuo sea la primera persona sorda conocida en la historia. En restos encontrados en el valle del Neander , en el estado alemán de Renania, se encontró en los años 50 del pasado siglo al primer Neanderthal, especie del género Homo que habitó Europa y partes de Asia Occidental desde hace 230 millones hasta hace 29 millones de años, durante lo que conocemos como Paleolítico medio. En casi todos los restos óseos de neanderthales adultos encontrados se observan señales de heridas o enfermedades, entre las que destacan las articulares degenerativas. Probablemente estas dolencias estaban provocadas por las duras condiciones de vida que tenían que soportar. 1 Cermi. (Internet). Madrid: Grupo Editorial Cinca; 2008 (citado 28 agosto 2013).Disponible en: http://www.cermi.es/esES/ColeccionesCermi/Cermi.es/Lists/Coleccion/Attachments/60/Laimage nsocia ldelaspersonascondiscapacidad.pdf 10 Puede que el Neanderthal más célebre de la historia con discapacidad fuera descubierto en 1908 al Sur de la actual Francia, con una antigüedad de 35.000 a 45.000 años. Se trata de un individuo que vivió entre 50 y 55 años con padecimiento de artritis que afectaba al cráneo, a la mandíbula, a la columna vertebral, a la cadera y a los pies. También tenía fracturada una costilla y había perdido la gran mayoría de sus dientes. Teniendo en cuenta que la edad media de esta especie rondaba la treintena, es fácil imaginar que este individuo dependiente necesitará de la ayuda de sus congéneres para poder sobrevivir en las condiciones de la época. Es posible que aportara algo a la comunidad desarrollando tareas compatibles con sus limitaciones, es decir, estaríamos hablando de una capacidad parcial, germen de las diferentes situaciones de Incapacidad vigentes hoy en día. Existen diferentes estudios que evidencian que, a pesar de los estereotipos populares sobre la evolución de las especies, en la prehistoria la vida incluía la capacidad y voluntad de ayudar a los enfermos crónicos y discapacitados. No podemos afirmar que esta manera de actuar fuera la habitual, ya que en la mayoría de las épocas, las enfermedades, los trastornos mentales o cualquier incapacidad y/o deficiencia eran consideradas como un mal, un tabú o un castigo de Dios. En Egipto a las personas con malformaciones se les consideraban especiales y se encontraban al servicio de los faraones2. Los hebreos dieron un tratamiento diferente a las personas con limitaciones pudiendo participar en los asuntos religiosos. El Judaísmo precursor del cristianismo al elevar la dignidad de la persona humana, hizo que se convirtiera en deber la atención a las personas con discapacidad. En Persia y Mesopotamia la discapacidad era considerada como un castigo de dioses aunque también había posiciones más humanas como las de Zaratustra, profeta iraní creador del zoroastrismo3. 2 Inzua Canales, Víctor. Una conciencia histórica y la discapacidad. Revista trabajo social Nueva Época.2001; 3: 77 11 En las culturas mesoamericanas4 (Olmecas, Mayas y Aztecas) las personas discapacitadas eran consideradas divinidades. Esta situación cambiaría posteriormente a partir del siglo XVI seguramente como consecuencia de la conquista española. Cabe mencionar como ejemplo el caso de una mujer de Oxaca que solicita le otorguen una Licencia de Ayuntamiento de la Ciudad de México para poder exhibir a su hijo discapacitado (enano) con la finalidad de poder ayudar a su esposo que estaba enfermo en su lecho. En la Grecia antigua, en su culto a la belleza y a la perfección física, a los discapacitados los expulsaban de las ciudades o los exterminaban. En Esparta en el siglo IX antes a.C. las leyes de Licurgo dictaminaban que los recién nacidos débiles o deformes fueran arrojados desde los alto del monte Taigeto. Esto cambió tras la reforma de Pericles (499-429 dc) donde se comienza a atender en centros asistenciales. En Roma se encontraban actitudes contrapuestas desde infanticidios a comercio con personas con discapacidad para diversión hasta el establecimiento de medidas para cuidar a personas con discapacidad y la creación de hospitales5 En la edad media y posteriormente en el cristianismo, las personas deformes o discapacitadas seguían siendo objeto de burla y segregación, pero poco a poco fue cambiando la consideración de estas personas debido en parte al cambio ideológico más humanista y moral. En La Cofradía de los Hermanos de la Costa6, que era una asociación de bucaneros del siglo XVII con centro de operaciones fijado en La Tortuga, pequeña isla al noroeste de La Española, actual Haití, tenían contemplado la 5 Aguado Díaz, Antonio León. Historia de las Deficiencias. Colección Tesis y Praxis. Madrid. Escuela Libre Editorial, Fundación ONCE. 1993 6 Isladelcofre (internet). 2013 (citado21 de agosto 2013). Disponible en: http://www.isladelcofre com/01normas.htm 12 indemnización a los lisiados en las batallas y abordajes. Llama la atención que incluso hacían distinciones en cuanto a la indemnización dependiendo se tratase de la amputación del brazo derecho (600 pesos o seis esclavos) o del izquierdo (500 pesos o cinco esclavos). No cabe duda que es la antesala de las actuales prestaciones por incapacidad temporal o permanente. Posteriormente en la edad moderna es más patente el cambio y el tratamiento hacia los discapacitados y enfermos, pasando a reconocer la responsabilidad de la sociedad hacia este colectivo. La evolución histórica de la discapacidad como hemos visto tiene varios enfoques. En primer lugar, podemos hablar de un enfoque mágico-religioso de las culturas antiguas con actitud social mayoritariamente de rechazo e incluso muerte. Sigue con un enfoque técnico y secularizado, entendiendo la discapacidad como resultado de fenómenos naturales que requieren terapia adecuada al igual que otras enfermedades, caracterizándose socialmente por la reclusión y cuidados para los necesitados. Posteriormente a finales del Siglo XIX y segunda guerra mundial es claro el enfoque médico y asistencial con creación de centros especiales de educación y atención que inevitablemente llevarían a estigmas de discriminación social y laboral. Por último desde la segunda mitad del siglo XX la prevención y rehabilitación son claves para conseguir la reinserción comunitaria de los discapacitados. El termino discapacidad según la OMS es un término que abarca las deficiencias, las limitaciones de la actividad y las restricciones de la participación. Las deficiencias son problemas que afectan a una estructura o función corporal; las limitaciones de la actividad son dificultades para ejecutar acciones o tareas, y las restricciones de la participación son problemas para participar en situaciones vitales Por consiguiente, la discapacidad es un fenómeno complejo que refleja una interacción entre las características del organismo humano y las características de la sociedad y del medioambiente en el que vive. 13 Esto lleva a que la discapacidad es el resultado de la condición de la salud de cada individuo más sus factores personales y ambientales, es decir, la interacción entre las limitaciones humanas y el medio en el que se encuentre. Este medio se trata del medio social, que a su vez se segrega en otros estratos como el laboral, personal, etc. 1.1. Incapacidad Temporal Hasta ahora hemos hablado de manera genérica del término discapacidad. El tema que nos trata, la Incapacidad Laboral (temporal), sigue los mismo patrones en cuanto su génesis y lleva asociado la interacción de los mismos factores. La discapacidad como tal lleva implícito un carácter permanente, el individuo no vuelve a recuperar las funciones perdidas salvo avance médico importante. En la incapacidad temporal (IT), el individuo va a presentar una serie de limitaciones funcionales, bien sean físicas o psíquicas, que le van a impedir temporalmente el desarrollo de sus actividades laborales habituales y/o actividades de la vida diaria. Las limitaciones que va a condicionar una situación de incapacidad o discapacidad son fruto de la pérdida de salud que sufra el individuo. El término enfermedad opera más como un hecho científico. Para entender mejor el concepto de IT, sería más correcto utilizar el término de dolencia, que desde un punto de vista antropológico sería la condición de falta de salud de un individuo o población. Esta condición de falta o ausencia de salud no necesariamente implica el desarrollo de una enfermedad. No podemos olvidar la influencia de la diversidad cultural en la percepción de la salud y subsidiariamente de la enfermedad. La falta o ausencia de salud determina las limitaciones que tendrá el individuo para desarrollar sus actividades. Estas las podemos dividir en dos grandes bloques, personales y laborales. 14 Dentro de las personales incluimos todas aquellas actividades o tareas que pertenecen a la parcela personal y social, así como su interacción. El bloque laboral sin embargo atañe exclusivamente a la actividad o desempeños que realiza el individuo en su trabajo. El concepto de Incapacidad temporal en relación con el trabajo redimensiona el concepto inicial, haciendo que aparezcan connotaciones económicas y de otras índoles en su tratamiento. En España desde la Ley de la seguridad Social, de 21 de abril de 1966 y el RD 3158/1966 de 23 de diciembre, por el que se aprueba el Reglamento General que determina la cuantía de las prestaciones económicas del Régimen General Seguridad Social y las condiciones para el derecho a las mimas, los cambios normativos en la regulación de la IT han sido numerosos. El Capítulo IV del Real Decreto Legislativo 1/1994, de 20 de junio, por el que se aprueba el Texto Refundido de la Ley General de la Seguridad Social define el concepto de IT como aquella situación en la que se encuentra el trabajador que, por causa de enfermedad común o accidente no laboral, esté impedido para el trabajo y necesite la asistencia sanitaria de la Seguridad Social. La IT estaría definida por la situación de enfermedad, la necesidad de tratamiento por los Servicios públicos de Salud y la incapacidad para desarrollar su actividad laboral habitual. Cuando la IT tiene origen exclusivamente laboral, es decir, producida por accidentes laborales o enfermedades profesionales hablamos de IT por Contingencia Profesional. De mismo modo cuando la IT es debida a enfermedad común o accidente no laboral hablamos de IT por Contingencia Común. La declaración de la situación de IT se realiza a través del parte médico de baja laboral expedido por el médico del Servicio público de salud o de la Mutua colaboradora con la seguridad Social (Mutua de Accidente de trabajo y Enfermedad Profesional de la Seguridad Social antes de la Ley 35/2014). La emisión de dicho parte lleva asociado el reconocimiento del derecho a la prestación por IT. 15 • Hay que cumplir unos requisitos mínimos para poder percibir dicha prestación (art. 130 LGSS): • Recibir asistencia sanitaria • Estar afiliado de la Seguridad Social y estar en situación de alta o asimilada • Tener cubierto un periodo mínimo de cotización que será de 180 días en los cinco años antes del hecho causante en el caso de la contingencia común. En el caso de contingencia profesional no es necesario dicho periodo. El elemento clave para la percepción de dicha prestación es la incapacidad para el desarrollo de la actividad laboral constituyendo la valoración de dicha incapacidad el principal elemento de control, es decir, para que un persona tenga derecho a la prestación por IT es necesario que exista un menoscabo funcional para desarrollar su actividad laboral. Pongamos un ejemplo: Un teleoperador que sufra un esguince leve de tobillo tendría una patología pero podría desarrollar su actividad laboral por lo que no le correspondería recibir la prestación de IT. La prestación que reciben los trabajadores cuando están en un periodo de IT varía en función se trate de una u otra contingencia. En el caso de la contingencia profesional el trabajador percibe el 75% de su base reguladora7 desde el día 1º del nacimiento del derecho. En el caso de la contingencia común el trabajador percibe el 60% de la base reguladora8 desde el 4º al 20º día y el 75% del día 21º en adelante. En la contingencia común la mutua asume el pago de la prestación a partir del decimoquinto día en el caso del Régimen General de trabajadores y a partir del tercer día en el caso de los trabajadores del Régimen General de Trabajadores Autónomos. 7 Se calcula dividiendo la base de cotización del mes anterior entre el número de días que corresponde a dicha cotización. A esto se le sumaría la cotización por horas extraordinarias en el año anterior dividido entre 365 días. 8 Se calcula dividiendo la base de cotización del mes anterior entre 30 días si tiene salario mensual o 28, 29 y 31 si tiene salario diario. 16 Hablar de IT es hablar de un problema con dimensiones sanitarias, sociales y económicas. El gasto de IT del Sistema (INSS, ISM, MUCOSS) en España9 y la evolución del Producto Interior Bruto10 (PIB) se ha comportado en el periodo estudiado como figura en el gráfico 1.1: Gráfico 1.1. Relación entre el gasto de IT del Sistema y el PIB en el periodo 2007-2012 Se observa un descenso en ambos ítems motivado principalmente por la situación de crisis económica, a pesar de esto es importante resaltar que el porcentaje promedio que representa el gasto por IT en relación al PIB se sitúa en el 0,65%, hecho que hace relevante el disponer de medios y poner en marcha mecanismos para disminuir dicho coste. 9 Seg-social: Anexo al informe económico financiero. Presupuestos ejercicio 2012 (internet). Madrid: Seguridad Social; 2012 (citado el 24 de julio 2013 ). Disponible en: http://www.segsocial.es/prdi00/groups/public/documents/binario/169364.pdf 10 Datosmacro (internet). Madrid. Abril 2015 (citado el 5 de mayo de 2015). Disponible en: http://www.datosmacro.com/pib/espana 17 La principal línea de ataque para conseguir disminuir el gasto de IT es la duración media de los procesos de IT. Si atendemos a la contingencia común hay una tendencia ascendente en la duración media de los procesos de IT en el Sistema (INSS, MUCOSS e ISM) de 2007 a 2012, según datos del Ministerio del Ministerio de Empleo y Seguridad Social11. Al desagregar las duraciones medias de los procesos del sistema según se trate de procesos del INSS, ISM o procesos de las MUCOSS, tenemos que hay diferencias bastantes significativas entre las duraciones (gráfico 1.2): Gráfico 1.2. Duraciones medias de los periodos de IT del INSS, ISM y MUCOSS en el periodo 2007-2012 11 Seg-social (internet). Madrid: Seguridad Social; 2015 (citado el 24 de julio 2013). Disponible en http://www.segsocial.es/Internet_1/Estadistica/Est/Otras_PrestacionesdelaSeguridadSocial/ Incapacidad_Temporal/index.htm 18 Sin embargo la incidencia de procesos de IT se comporta de manera descendente en las series estudiadas, mediado en parte por la crisis económica y la disminución de trabajadores afiliados a la seguridad social. La duración de un proceso de IT responde a una serie de tiempos que influyen directamente sobre el coste de cada uno (Gráfico1.3): Gráfico 1.3. Tiempos que influyen en el coste de los procesos de IT Los tiempos de gestión administrativa y tiempos de gestión engloban todos los tiempos intermedios de aquellas tareas no médicas, es decir, emisión de partes de IT, reconocimiento del derecho a la prestación, citaciones, toma de decisiones, etc. Los tiempos de espera asistencial derivan de las listas de espera que haya en cada comunidad. Por último los tiempos biológicos atañen exclusivamente a la duración de cada patología y que se verá modificada por las diferentes variables que influyen en la curación o factores de corrección como veremos más adelante. 19 La gestión de la IT en España tiene varios actores, por un lado tenemos al INSS o ISM, por otro lado tenemos a los servicios Médicos de la Inspección Sanitaria y por último a las MUCOSS. Actualmente en la gestión de los procesos de IT se inician actuaciones una vez se ha producido la baja laboral. Existen patrones de incidencia de determinadas enfermedades en las distintas épocas del año según el comportamiento observado en serie temporales, como por ejemplo el aumento de la incidencia de la patología respiratoria de octubre a febrero. Esto permite plantear medidas generales en relación a la gestión de cada patrón. Con un modelo predictivo de duración de procesos en IT se podría estimar la duración de cada proceso a partir de algunas de las posibles variables o factores que intervienen. Este tipo de información es de gran ayuda para todos los organismos que intervengan en la gestión de la IT. 20 2. • OBJETIVOS Recoger y sistematizar los registros de procesos de incapacidad temporal del periodo 2008-2012 en España de una Mutua Colaboradora con la Seguridad Social. • Conocer el comportamiento de dichos procesos en relación con las variables de estudio. • Comparar métodos estadísticos en relación a la predicción de duración la de incapacidad temporal en la enfermedad común • Establecer un modelo idóneo de predicción para la duración de procesos de incapacidad temporal en la enfermedad común. 21 3. MATERIAL Y MÉTODOS Para el desarrollo de esta tesis se ha utilizado el paquete estadístico SPSS v19.0, el programa R v3.1, el programa Microsoft Excel 2010, el programa Microsoft Access 2010 y el editor de texto Microsoft Word 2010. 3.1. Consideraciones previas sobre los datos La base de datos sobre la que se desarrolla el estudio fue proporcionada por Ibermutuamur, Mutua de Accidentes de Trabajo y Enfermedades Profesionales de la seguridad social nº 274. En Anexo I se adjunta la el documento de autorización para el análisis de los datos. Se trata de una base anónima con procesos de 1.085.824 pacientes que hubieran sido alta médica tras un episodio de IT por contingencia común durante el periodo comprendido del 01/01/2008 al 31/12/2012. La base inicial constaba de 39 variables de cada uno de los procesos lo que lleva a un total de 42.347.136 entradas. Las variables iniciales fueron: 1. Fecha de baja: Indica la fecha en la que el trabajador es baja médica por IT. 2. Fecha de alta: Indica la fecha en la que el trabajador es alta médica por IT. 3. Días en baja: Indica número de días en los que el trabajador ha estado en situación de baja médica. Variable cuantitativa discreta. 4. Sexo: Indica el sexo del trabajador. Variable cualitativa nominal. 5. Edad: Indica la edad en años del trabajador. Variable cuantitativa discreta. 22 6. Ocupación: Indica la ocupación del trabajador según la Clasificación Nacional de Ocupaciones del 2004 (C.N.O 04). Variable cualitativa nominal. 7. Recaída: Indica si el trabajador ha tenido recaída de un episodio previo. Variable cualitativa nominal. 8. Número de episodio: Indica el número de procesos que ha tenido en baja en el periodo estudiado. Variable cuantitativa discreta. 9. Tipo de contrato: Indica el tipo de contrato del trabajador según sea indefinido o de duración determinada, a tiempo completo o parcial. Variable cualitativa nominal. 10. Provincia: Indica la provincia de residencia del trabajador. Variable cualitativa nominal. 11. Municipio: Indica el municipio de residencia del trabajador. Variable cualitativa nominal. 12. Diagnóstico: Indica el diagnóstico principal según la CIE 9 MC que motiva la baja médica. Variable cualitativa nominal. 13. Codiagnóstico 1-4: Indica los codiagnósticos que tenga cada trabajador. Variable cualitativa nominal. 14. Base reguladora: Indica la base de cotización diaria de cada trabajador. Variable cuantitativa continua. 15. Tiempo Baja-Recepción: Indica el tiempo transcurrido entre la fecha de emisión del parte de baja médica hasta la fecha de recepción de dicho parte en la Muta. Variable cuantitativa discreta. 16. Tiempo Recepción-Grabación: Indica el tiempo transcurrido entre la fecha de recepción del parte de baja médica en la mutua hasta la fecha de grabación de dicho parte. Variable cuantitativa discreta. 17. Cuenta: Indica si el trabajador está afiliado al régimen General de la Seguridad Social (cuenta ajena) o al Régimen especial de Trabajadores autónomos (cuenta propia). Variable cualitativa nominal. 18. Pago: Variable cualitativa nominal. 19. Estado Civil: Indica el estado civil de cada trabajador. Variable cualitativa nominal. 20. Número de hijos: indica el número de hijos de cada trabajador. Variable cuantitativa discreta. 23 21. Fumador: Indica el hábito tabáquico de cada trabajador. Variable cualitativa nominal. 22. Bebedor: Indica el hábito alcohólico de cada trabajador. Variable cualitativa nominal. 23. Antecedentes: Se segrega en 16 variable dicotómicas que son: Hipertensión, dislipemia, diabetes tipo I, diabetes tipo II, cardiopatía isquémica, sobrepeso, neoplasia de colon, neoplasia de mama, linfoma, leucemia, trastorno de ansiedad, enfermedad pulmonar obstructiva crónica, artrosis, fibromialgia y artritis reumatoide. Variables cualitativas nominales. Posteriormente se realizó una recodificación de las variables quedando las anteriores más: 1. Quintil episodio: Indica el quintil del número de episodio del cada proceso. 2. LN días baja: Indica el logaritmo neperiano de la duración de cada proceso. 3. Quintil edad: Indica el quintil de la edad de cada trabajador. 4. Antecedentes: Indica si el trabajador tiene o no antecedentes. Variable cualitativa nominal. 5. Hijos: Indica si el trabajador tiene o no hijos. Variable cualitativa nominal 6. Quintil base reguladora: Indica el quintil de la base reguladora de cada proceso. 7. Contrato 1: Indica si el trabajador tiene contrato a tiempo completo o a tiempo parcial. 8. Contrato 2: Indica si el trabajador tiene contrato indefinido o de duración determinada. 9. Codiagnóstico: Indica si el proceso tiene o no tiene codiagnóstico. Variable cualitativa nominal. 10. Numero codiagnóstico: Indica el número de codiagnósticos de cada proceso. Variable cuantitativa discreta. 11. Codiagnóstico 1: Indica que codiagnóstico tiene cada proceso. Variable cualitativa nominal. 24 12. Comunidad: Indica la comunidad autónoma de residencia de cada trabajador. Variable cualitativa nominal. Finalmente las variables que se tuvieron en cuenta después de la exploración inicial de datos fueron el diagnóstico, el tipo de cuenta, el tipo de pago, la ocupación, el tramo de edad de los registros, la existencia o no de codiagnóstico, el hecho de tener hijos o no, la provincia de origen, el tipo de contrato, la existencia de recaída previa, el estado civil, el sexo, el número de episodios previos de IT y el hábito tabáquico. Desde el punto de vista de método se encontraron algunas limitaciones como: • Elevado número de diagnósticos de la CIE-9 Mc que implica mucha variabilidad previa en la codificación y hace imposible incluir todas las entradas en el modelo. • Identificación de error en codificación por subregistro. Esto obligó a eliminar aquellos registros con incongruencia entre duración y diagnóstico. • Elevada cantidad de valores perdidos en registro de algunas variables de procesos que hacían imposible obtener resultados y conclusiones fiables. Como criterios de exclusión de casos se definieron los siguientes: • Diagnósticos con menos de 2500 casos. • Casos con duración superior a 365 días • Subregistros por error en codificación. • Casos en los que lo aparecía diagnóstico codificado. Posteriormente la base se inicial se redujo a los casos pertenecientes a 47 diagnósticos que se distribuyeron en 29 epígrafes obteniendo finalmente una base de 370.076 casos. La codificación diagnóstica utilizada es la CIE-9MC, en Anexo II se muestra la distribución de los 46 diagnósticos en los 29 epígrafes finales. 25 Desde el punto de vista estadístico se plantearon dos problemas fundamentales: determinar las fuentes de variabilidad de las que depende la duración de la baja y proponer un modelo predictivo en consonancia para pronosticar dicha duración. No obstante, una vez escogido el modelo predictivo se reconsideró la importancia de las variables seleccionadas en primera instancia. Se partió con las ventajas que se derivan de la gran cantidad de información disponible, tanto en lo relativo al tamaño muestral como al número de variables explicativas. No obstante y como reverso de la moneda, la gran cantidad de información conlleva ciertas dificultades de análisis que no se presentan en estudios más someros. En primer lugar, el gran tamaño muestral se traduce en resultados significativos para la gran mayoría de los contrastes de hipótesis que podamos plantearnos, de ahí que no pudimos contar con una herramienta tan tradicional en la estadística como es el test de hipótesis a la hora de tomar decisiones. No obstante, en las últimas décadas, propiciado por el uso del software estadístico y la necesidad de analizar grandes archivos de datos, se han popularizados un conjunto de técnicas no paramétricas (es decir, que no suponen modelo alguno de distribución de los datos, sino que buscan un ajuste a toda costa de las observaciones, aunque ello implique perder la explicación o interpretación global del modelo que trasmiten los parámetros), que reciben la denominación genérica de Minería de Datos y que, a la postre, han tenido en nuestro estudio un protagonismo superior al de las técnicas paramétricas clásicas. En segundo lugar, el manejo de una gran cantidad de variables explicativas puede considerarse un reto desde el punto de vista estadístico que, cuando todas ellas son de tipo cualitativo, como es nuestro caso, se convierte en un serio problema, dado que nos impidió abordar nuestro estudio mediante el uso de algoritmos automáticos de selección de variables que están ideados en principio para variables numéricas. Con la intención de no caer en la trampa de convertir nuestro estudio en un rastreo incierto de modelos predictivos más o menos novedosos, optamos por fijar como punto de partida el análisis de los datos a través del Modelo Lineal 26 Normal, que constituye el núcleo de la Estadística Paramétrica. Obramos así con el doble objeto de obtener una idea preliminar (aunque a la postre resultará muy certera) de la capacidad predictiva de nuestras variables, y de fijar las fuentes de variabilidad que debemos contemplar en modelos alternativos, dado que un modelo completo que contemplara todas las posibles interacciones entre las diferentes variables predictivas sería inviable debido a la enorme cantidad de parámetros del mismo. A continuación, una vez centrados en dicha fuentes de variabilidad, procedimos a comparar la validez de todos aquellos modelos predictivos que juzgamos a priori razonables para nuestros datos, obteniendo como resultado de la comparativa un modelo de predicción definitivo. Posteriormente, la importancia de las variables seleccionadas en primera instancia se volvió a someter a valoración. 3.2. Variables a considerar y modelo predictivo Una vez definidas las variables dividimos el método estadístico en tres pasos: 3.2.1. Modelo Lineal y selección de las fuentes de variabilidad a contemplar en lo sucesivo (paso nº1) Así pues, nuestro primer objetivo era entender qué variables explicativas son realmente importantes en el pronóstico del tiempo de baja y cómo cuantificar, al menos en primera instancia, la capacidad predictiva de dichas variables. El modelo lineal a contemplar en esta fase del estudio debía poseer un número de parámetros manejable en la práctica. En definitiva, nos enfrentamos a un laborioso trabajo de ensayo con diferentes combinaciones de factores e interacciones, buscando el modelo más sencillo posible entre todos aquellos que proporcionen un buen ajuste a las observaciones. 27 Los diferentes métodos estadísticos deben proporcionar parámetros que informen del ajuste del modelo a los datos reales, como pueden ser el coeficiente de correlación lineal múltiple R2 de Pearson, el coeficiente R2 corregido, la devianza, el logaritmo de la verosimilitud, el Criterio de Información Bayesiano (BIC), el Criterio de Información de Akaike (AIC), o los pseudocoeficientes R2 de Nagalkerkel y de Cox-Snell, si bien el parámetro que goza de una interpretación más diáfana desde un punto de vista formal es el primero de los mencionados: el coeficiente R2 que proporciona el modelo lineal. No obstante y por lo dicho anteriormente, en nuestro caso deberíamos empezar prestando atención a algún parámetro que penalice la inclusión de variables predictoras no esenciales, como por ejemplo el R2 corregido o en el BIC. Por ello, el objetivo en esta fase del estudio fue ajustar nuestros datos con un modelo lineal haciendo uso de diferentes combinaciones de factores e interacciones, con el objeto de encontrar un alto valor de R2 con el menor grado de libertad posible o mejor, y para establecer un criterio más objetivo, maximizar el BIC. No pretendíamos obtener así un modelo definitivo sino seleccionar los factores e interacciones fundamentales con los que trabajar tanto en el modelo lineal como en otros posteriores, como el modelo de regresión gamma, el logístico o el árbol de decisión (modelos de regresión de Cox12 como en el caso de Barceló13 no han sido contemplados, dado que estamos interesados en la predicción de la duración del proceso de IT). Un simple vistazo a la variable respuesta (gráfico nº 3.1), el tiempo en días que dura la baja, con un pronunciado sesgo positivo, reveló la incapacidad de ajuste de un modelo lineal normal. 12 Van Belle G., Fisher L.D., Heagerty P.J., Lumley T. Bioestadistics. A methodology for the Health Sciences. 2ª ed. Wiley ;2004 13 Barceló M.A. Modelos Marginales y Condicionales en el Análisis de Supervivencia Multivariante. Gac. Sanit. 2002;16 (2):59-68 28 Gráfico 3.1. Distribución de las duraciones de los procesos según su frecuencia Efectivamente, cuando se trabaja con variables que expresan tiempos de espera puede parecer en principio más ortodoxo contemplar modelos probabilísticos tipo exponencial o, más en general, Gamma14 . No obstante y por las razones indicadas anteriormente, optamos por una solución muy común (que a la postre resultará prácticamente equivalente), consistente en ajustar mediante un modelo lineal normal el logaritmo del tiempo de baja. Pudimos apreciar que, tras aplicar el logaritmo, el sesgo positivo se reduce considerablemente, como cabría esperar, aunque persistía una cola de valores extremos a la derecha. Estamos hablando de un colectivo de individuos cuyos tiempos de baja eran extremos. Ese colectivo podría entenderse como una subpoblación que se identificaría fácilmente mediante un análisis clúster 15 . Pero dicho análisis no deja de ser una partición ad hoc de la muestra estudiada 14 Benavides F.G. et al. Reincorporación al trabajo después de un episodio de Incapacidad Temporal por contingencia común: Papel de la edad, el sexo, la actividad económica y la comunidad autónoma. Rev. Esp. Salud Pública. 2007;81(2):183-190 15 Everitt B., Horton T., An Introduction to Applied Multivariante Analysis with R. Londres: Springer Science+Business Media; 2011. 29 que, en nuestro caso, no correlaciona claramente con ninguna de las variables explicativas consideradas. Éste es, en esencia, el verdadero problema con el que nos topamos en nuestro estudio, como detallaremos más adelante. A pesar de todo, el modelo lineal aplicado al logaritmo logró un ajuste bastante aceptable en nuestra opinión, tal y como se muestra en el Anova de la tabla nº 3.1. Pruebas de los efectos inter-sujetosb Variable dependiente:Lndiasbaj Suma de cuadrados tipo Origen III Media gl Eta al cuadrado cuadrática F Sig. parcial a 124 1371,811 2876,552 ,000 ,638 Intersección 23130,433 1 23130,433 48502,245 ,000 ,193 RDGT 16496,023 28 589,144 1235,376 ,000 ,146 831,375 1 831,375 1743,312 ,000 ,009 6558,222 1 6558,222 13751,947 ,000 ,064 OCUPACION 105,375 10 10,537 22,096 ,000 ,001 TRAMEDAD 783,383 4 195,846 410,669 ,000 ,008 CODGTdico 1009,214 1 1009,214 2116,223 ,000 ,010 HIJOSDICO 180,592 1 180,592 378,683 ,000 ,002 2105,407 3 701,802 1471,611 ,000 ,021 78,077 1 78,077 163,720 ,000 ,001 RECAIDA 451,256 1 451,256 946,239 ,000 ,005 RDGT * SEX 787,255 29 27,147 56,924 ,000 ,008 1943,491 28 69,410 145,547 ,000 ,020 TRAMEPI * FUMADICO 184,262 11 16,751 35,125 ,000 ,002 ECIVIL 693,908 5 138,782 291,012 ,000 ,007 Error 96552,926 202462 ,477 Total 1006380,690 202587 266657,459 202586 Modelo corregido CUENTA PAGO Rprov CONTRAT1 RDGT * PAGO Total corregida 170104,533 a. R cuadrado = ,638 (R cuadrado corregida = ,638) b. Regresión de mínimos cuadrados ponderados - Ponderada por Ponderación para Lndiasbaj de WLS, MOD_4 PAGONUM** -1,000 Tabla 3.1. Prueba Anova de los efectos de las variables Hemos de especificar que éste fue el modelo, de entre todos los considerados en una fase inicial de ensayo, que aportó un máximo valor del Criterio de Información Bayesiano (BIC=1072221) y del R2 corregido. Inicialmente, obtuvo un coeficiente de correlación lineal múltiple R2=0.600, es decir, que se explica el 60% de la varianza total del logaritmo de los días de baja si conocemos los valores de las variables predictivas. Para valorar este parámetro en su justa medida hemos de tener en cuenta que la varianza viene a ser una media de los 30 errores cuadráticos respecto a la estimación, es decir, que penaliza los grandes errores. Además, se apreció que los individuos que tenían pago delegado presentaban claramente mayor dispersión, lo cual fue compensado mediante la técnica de Mínimos Cuadrados Ponderados16 (MCP), es decir, ponderando inversamente en el modelo según la varianza obtenida en las distintas categorías de dicha variable, con lo cual el valor de R2 se incrementó a 0.638 (aunque, al tratarse de un Modelo Lineal con MCP, ya no puede interpretarse como antes de manera literal). El modelo resultante consta de un total de 124 parámetros. Su aptitud viene dada por el alto valor de R2 y porque el hecho de incluir nuevos factores o interacciones en el modelo no lograría incrementarlo. Indicar una medida clara de la fiabilidad global del modelo inicial de referencia (R2=0.638) supone una ventaja frente a otros estudios en los que se proponen técnicas, en principio interesantes, pero no se aportan medidas sobre la capacidad predictiva de las mismas. Un valor R2=0.638 mediante un procedimiento lineal clásico nos informa de una importante capacidad de predicción en general, aunque también revela ya de entrada una clara deficiencia a la hora de efectuar una pronóstico exacto. Esta deficiencia podría ser solventada en principio mediantes métodos de predicción alternativos, como describiremos en el 2º paso, aunque adelantamos aquí que no fue el caso. Valorar el ajuste del modelo únicamente en función de R2 sería incorrecto y nos vimos obligados a complementarlo con un análisis de los residuos. En el gráfico 3.2 podemos apreciar los residuos brutos y en el gráfico 3.3 los residuos frente a los valores ajustados. 16 Rawlings, J.O., Pantula S.G., Dickey D.A. Applied Regression Analysis. 2ª Ed. New York: Springer; 1998 31 Gráfico 3.2. Análisis de los residuos del modelo Gráfico 3.3. Diagrama de dispersión de los residuos frente a los valores ajustados 32 Por último, en el gráfico 3.4 podemos ver los valores ajustados frente a los valores reales del logaritmo del tiempo de baja. Gráfico 3.4. Diagrama de dispersión de los valores ajustados frente a los valores del logaritmo A grandes rasgos se aprecia un comportamiento bastante satisfactorio. Un análisis más detallado del gráfico 3.3 puede revelar la presencia de valores altos de la respuesta no explicados por las variables del modelo. Pero hemos de recalcar que consideramos aceptable el ajuste logrado por el modelo lineal normal con MCP para el logaritmo del tiempo. La propia tabla del Anova (tabla 3.1) nos muestra en su última columna las estimaciones de los tamaños de los efectos. Estos parámetros, que en rigor debemos entenderlos como sucedáneos de los coeficientes de correlación 33 parcial propios del análisis de regresión lineal, nos dieron una idea orientativa del peso de las diferentes fuentes de variabilidad en la variable respuesta. Cabe destacar en ese sentido, como cabía esperar, la gran influencia del diagnóstico. También pudimos resaltar una gran importancia del tipo de pago. 3.2.2. Estudio comparativo de los diferentes modelos de predicción (paso nº2) Tras determinar las fuentes de variabilidad que se contemplaron en lo sucesivo pasamos a aplicar diferentes modelos a priori razonables con la idea de seleccionar el que proporcionase predicciones más fiables. Para evitar el efecto de sobreajuste propio de cualquier modelo estadístico, en especial los de tipo no paramétrico, optamos por dividir la muestra en dos partes: un 70% de los datos (entrenamiento) los utilizamos para elaborar los algoritmos de los diferentes modelos, que fueron aplicados al 30% restante (validación) para probar la fiabilidad de las predicciones. 3.2.2.1. Modelo Lineal El primer modelo a evaluar en la muestra de validación es el lineal17 . En el apartado anterior aplicamos un modelo lineal con ponderación al logaritmo del tiempo de baja. Ello implica aplicar dos transformaciones a la variable respuesta que debemos deshacer si pretendemos efectuar una predicción del tiempo de baja. En el gráfico 3.5 presentamos un histograma con los errores de pronóstico final. En la tabla 3.2 se muestra una descriptiva de los mismos. 17 Rawlings, J.O., Pantula S.G., Dickey D.A. Applied Regression Analysis. 2ª Ed. New York: Springer; 1998 34 Gráfico 3.5. Histograma de los errores del pronóstico final En el gráfico 3.6 podemos apreciar una diagrama de dispersión de los valores predichos frente a los reales, asociado a un coeficiente de correlación de Pearson r=0.587, aunque esta medida no puede interpretarse adecuadamente cuando la relación entre las variables no es lineal, como ocurre en nuestro caso. Se observaron claros desajustes en los individuos con tiempos de baja muy elevados, que provocaron a su vez desajustes en los individuos con menores tiempos de baja. Como cabría esperar, la relación entre los rangos descrita por el coeficiente de correlación de Spearman es más elevada (rS=0.767). Este coeficiente es más apropiado para describir el comportamiento de nuestro modelo. 35 Gráfico 3.6. Diagrama de dispersión de los valores predichos frente a los reales 3.2.2.2. Árbol de regresión Esta alternativa no paramétrica al análisis de la varianza no es de aplicación en este caso pues, dado que todas las variables predictoras son categóricas y que la predicción para cada nodo terminal consiste en el valor medio del mismo, si no imponemos restricciones en la profundidad del árbol podemos considerarlo equivalente a un modelo factorial completo del análisis de la varianza (modelo lineal), que no debería aplicarse a la variable tiempo sino a su logaritmo. No obstante, la variante categórica de este método, el árbol de decisión, tendrá un papel central en nuestro estudio, como veremos más adelante. 36 3.2.2.3. Modelo de regresión gamma Como hemos comentado anteriormente, aplicar un modelo de regresión gamma18 puede resultar en principio más natural que transformar los datos para forzar la aplicación de un modelo lineal. El primer dilema que se nos presentó es qué función de enlace debemos considerar: ¿el logaritmo o la función inversa? Sobre este particular no existe unanimidad de criterios, aunque el logaritmo es la opción que suele considerarse por defecto. No obstante, hemos de advertir que en este trabajo hemos ensayado con las dos y las predicciones resultantes varían de manera casi imperceptible. Mostraremos aquí únicamente los resultados del modelo gamma con enlace logarítmico (loggamma). Lo más destacable es que los pronósticos basados en el modelo lineal presentaron una correlación lineal de Pearson r=0.977 con los pronósticos basados en el modelo log-gamma (con la muestra de validación), es decir, presentaron un comportamiento muy similar con la salvedad de que el modelo gamma aportó tiempos de baja sistemáticamente más altos, como queda patente en la tabla 3.2. En los gráficos 3.7 y 3.8 aparecen el histograma para los residuos brutos y el diagrama de dispersión de los valores pronosticados frente a los reales, al cual corresponde coeficiente de correlación de Pearson y Spearman r=0.600 y rS=0.760, respectivamente. 18 Ahan H. Log-gamma regression modeling through regression tree, Communications in Statistics, Theory an methods. Arkansas: National center for toxicology Research, Food and Drug Administration; 1996 37 Gráfico 3.7. Distribución de los residuos brutos Gráfico 3.8. Histograma de los valores pronosticados frente a los reales 38 Desviación Media Error_lineal Mediana típica Percentil 25 Percentil 75 N válido 10.770 .000 43.716 -3.000 7.000 N=61014 Error_gamma -.769 -2.304 43.080 -14.170 1.707 N=61014 Residuo_lineal_gamma 2.433 -1.000 42.446 -7.000 3.000 N=61014 Tabla nº 3.2. Comparativa de los errores cometidos por los modelos lineal, gamma y mixto Que los modelos lineal con logaritmo y gamma aporten predicciones fuertemente correlacionadas es de esperar aunque los métodos de estimación de los parámetros del modelo sean diferentes. Efectivamente, en el primer caso hemos intentado explicar linealmente, a partir de las variables controladas, la media del logaritmo del tiempo; en el segundo, hemos intentado explicar linealmente el logaritmo de la media. En ambos casos estamos asumiendo implícitamente una relación multiplicativa entre los factores controlados y la respuesta. Ello puede explicar que, en nuestro caso, ambos modelos conduzcan a conclusiones similares. Algo parecido puede decirse del modelo de regresión de Cox, con la salvedad de que, en tal caso, se asume una relación multiplicativa de los factores con la denominada función de riesgo. Dado que no puede considerarse un modelo predictivo no haremos hincapié en este último. En definitiva, la diferencia entre el pronóstico lineal y el gamma consistió básicamente en que el segundo predijo por término medio unos 11 día más de baja. No es fácil decidir de manera objetiva si este comportamiento mejora o no el ajuste. Como ya hemos comentado, existen diversos valores relacionados con la bondad de ajuste del modelo lineal generalizado, como la devianza, pero no son de utilidad para nosotros porque en el caso lineal se ha llevado a cabo una transformación logarítmica seguida de una ponderación en función del tipo de pago. En todo caso, según hemos indicado antes, el modelo gamma presenta una correlación algo más fuerte con el valor real de la respuesta. Si nos atuviéramos a las medias y teniendo en cuenta que las desviaciones típicas son similares, según se aprecia en la tabla nº 3.2 (elaborada a partir de la muestra de validación), el modelo gamma sería claramente mejor, pues casi 39 acierta en media, pero la conclusión sería contraria si nos centráramos en el análisis de los cuartiles, pues el modelo lineal acierta en mediana, mientras que el modelo gamma tiende a predecir tiempos de baja excesivos a una gran cantidad de individuos que obtienen el alta relativamente pronto. No obstante, esta discusión queda zanjada por el simple hecho de que ambos conducen a predicciones muy poco fiables del tiempo exacto de baja y, por lo tanto y en nuestra opinión, poco útiles en términos prácticos. Estas opciones quedan pues desechadas por el momento, aunque volveremos sobre ellas más adelante. 3.2.2.4. Modelo de predicción categórica No obstante, si rebajamos nuestras pretensiones iniciales podemos sacar provecho a la cuantiosa información que aportó la muestra. Nuestro nuevo objetivo, más modesto aunque de gran utilidad, es determinar si la baja del paciente se prolongará más de 15 días, fecha en la que las MUCOSS asumen la prestación económica de los trabajadores pertenecientes al Régimen General como ya hemos comentado previamente. En ese caso, la respuesta es una variable categórica dicotómica. 3.2.2.4.1. Categorización de pronósticos lineal y gamma Inicialmente, procedimos a categorizar los pronósticos obtenidos mediante los modelos lineal y gamma con los resultados siguientes (para la muestra de validación). Los resultados se presentan en la tabla 3.3, donde quedó nuevamente patente que el modelo gamma tiende a dar pronósticos más elevados. Parece claro que ambos modelos, en especial el gamma, fracasan a la hora de detectar las bajas breves. 40 Lineal categorizado Gamma categorizado % acierto baja <15 43.5 36.5 % acierto baja>15 88.5 96.2 Tabla 3.3. Resultados de la categorización de los pronósticos de los modelos lineal y gamma 3.2.2.4.2. Regresión logística binaria Un modelo que se antoja más natural para abordar este problema de decisión es el de regresión logística binaria19, considerando las fuentes de variabilidad que fijamos en la sección anterior. Apreciamos un comportamiento bastante aceptable del modelo. Concretamente, se obtuvo un R2 de Nagelkerke de 0.631 para la muestra de entrenamiento, y una estimación las probabilidades de acierto a partir de la muestra de validación del 88.0% y 80.8%, según se muestra en la tabla 4 (85.3% en términos globales). La prueba de HosmerLemeshov aportó un resultado no significativo (P=0.066) lo cual nos induce a pensar que no existe un modelo alternativo que mejore sustancialmente estas predicciones (como confirmaremos posteriormente). Si aplicamos un algoritmo de selección de variables (adelante-Wald) podemos eliminar algunas fuentes de variabilidad pero, por el contrario, la probabilidad de acierto cae al 74.1% en el grupo de las bajas prolongadas, por lo cual optamos por desechar esta opción. 3.2.2.4.3. Árbol de decisión Todos los métodos mencionados hasta el momento salvo éste son de tipo paramétrico, es decir, el modelo de distribución de las observaciones (contemplando posibles transformaciones de las mismas) queda determinado de antemano excepto por el desconocimiento de ciertos parámetros que 19 Hosmer D.W. &Lemeshow S..Applied Logistic Regression. 2ª ed. New York .Willey; 1989 41 debemos estimar. La mayoría de las técnicas que abordamos a partir de este momento son de carácter no paramétrico y se circunscriben, como dijimos al inicio de la sección, a la rama de la Estadística denominada Minería de Datos19. En el problema que nos atañe, si en lugar de buscar el pronóstico exacto del tiempo de baja nos conformamos con una decisión categórica (mayor a menor de 15 días), el método no paramétrico más apropiado es el denominado árbol de decisión20, que aplicamos considerando todas las variables explicativas fijadas en la fase inicial. En primer lugar, debimos decantarnos por un árbol de decisión simple o por un procedimiento iterativo basado en el mismo. En esta segunda categoría consideraremos dos opciones: el bosque aleatorio y el Adaboost. Cuando se aplica un árbol de decisión simple conviene estimar las probabilidades de acierto dividiendo la muestra al azar en dos bloques: entrenamiento y validación. Dicha división introduce una componente aleatoria que es fuente de variabilidad en la estrategia resultante, lo cual puede compensarse mediante un remuestreo o bootstrap. Cuando contamos con muchas variables explicativas, siendo una de ellas preponderante en la predicción (tal es el caso de la variable diagnóstico), el remuestreo por sí sólo no suele conducir a una reducción de la variabilidad, pero ésta puede conseguirse si, para cada submuestra y en cada nodo, se eligen al azar una pequeña cantidad de variables explicativas para construir a partir de las mismas nodos filiales. Dicha técnica se denomina bosque aleatorio y puede aplicarse haciendo uso del paquete randomForest del programa R. Es para muchos la técnica idónea para obtener el mejor ajuste en el problema de clasificación21 . 20 Hastie T., Tibshirani R., Friedman J. The elements of Statistical Learning. 2ª Ed. California: Springer; 2008 21 James G., Witten D., Hastie T., Tibshirani R. An Introduction to Statistical Learning. Londres: Springer. 2013 21 Freund, Y. and Schapire, R. A decision-theoretic generalization of online learning and an application to boosting. Journal of Computer and System Sciences. 1997: 55;119-139. 42 Sin embargo, nosotros optamos por desechar el algoritmo de bosque aleatorio por tres razones: primero, porque no proporciona un algoritmo entendible que pueda implementarse de manera fácil sin la necesidad de contar con la base de datos completa; segundo, porque la variabilidad mencionada anteriormente quedó muy reducida en nuestro caso por el gran tamaño de la muestra; por último, el propio tamaño de la muestra no permitió la aplicación del comando randomForest en un ordenador convencional a la muestra completa. Otro técnica tipo Boosting20 basada en el árbol de decisión simple que pudo contemplarse en nuestro caso es el algoritmo Adaboost21, método cuyo resultado depende de una suma ponderada de diferentes árboles de decisión que se van añadiendo iterativamente con la intención de explicar el comportamiento de los datos peor ajustados. Se aplicó esta técnica con 10 iteraciones haciendo uso del paquete Adabag del programa R, proporcionando unas proporciones de acierto del 90.3% para las bajas inferiores a 15 y del 75.0% para las superiores a 15 días, lo cual nos lleva a desecharla en beneficio del árbol de decisión simple, que aporta unos resultados similares, como veremos a continuación. Para aplicar el algoritmo de árbol de clasificación simple y de acuerdo con la literatura estadística (Hastie et al. (2008)), optamos por el método más natural que es, hasta donde sabemos, el CART, considerando en principio la medida de impureza Gini, que goza de una interpretación bastante intuitiva en términos estadísticos. No obstante, se ensayó con otras posibilidades. Dado el gran tamaño de la muestra no fue necesario imponer cotas especiales a los tamaños de los nodos. Aunque el método CART construye por defecto árboles con un máximo de 5 niveles ensayamos con la posibilidad de incluir hasta 10. Aplicado a la variable dicotómica (<15 o >15) se obtuvo como resultado unas probabilidades de clasificación correcta de 90.2% (<15) y 76.0% (>15) para la muestra de validación, tal y como queda reflejado en la tabla (85.9% en términos globales). El resultado fue levemente mejor en términos globales que el de la regresión logística binaria (algo mejor para las bajas breves y algo peor para las largas). 43 3.2.2.4.4. Método mixto lineal-gamma Dado que no queríamos resignarnos a una predicción dicotómica del tiempo de baja, optamos por obrar de manera similar a Ahan (1996) y ajustar el tiempo de baja (logaritmo) mediante un modelo lineal para los individuos con un pronóstico inferior a 15 días, según el árbol, y ajustar el tiempo de baja mediante un modelo log-gamma para los demás. Optamos por este diseño teniendo en cuenta que el modelo gamma aporta tiempos de baja superiores al lineal. La fase inicial de este método consistió en decidir si el paciente estaría más o menos de 15 días de baja. Para ello elegimos el árbol de decisión porque aplicar la regresión logística conllevaría someter los mismos datos a dos variantes del modelo lineal generalizado. De esta forma, las predicciones sobre la muestra de validación aportaron una correlación con el tiempo real de r=0.615 (rS=0.745), lo cual podría interpretarse como una leve mejora de las correlaciones obtenidas por el método lineal (r=0.587) y el gamma (r=0.600). Los valores típicos de los residuos se muestran en la tabla 3.2. Seguíamos pensando que estos valores eran insuficientes para dar un pronóstico aceptable. Nuestra percepción fue que para aspirar a predecir el tiempo exacto de la duración de la baja necesitábamos algún tipo de un información (variable explicativa) con el que no contábamos en esos momentos y que nos permitiría distinguir claramente a los pacientes cuyas bajas se van a prolongar inopinadamente. De todas formas, de tener que elegir una ecuación, sería la que se obtiene por este método, que cuenta con 248 parámetros. Otra opción que descartamos también fue aplicar, bien el modelo lineal al logaritmo del tiempo o bien el log-gamma al tiempo de baja, pero incluyendo como covariable la probabilidad de que la baja sea inferior a 15 días, estimada por el árbol de decisión, pero no conseguimos mejorar en nada la predicción, a juzgar al menos por las correlaciones obtenidas. 44 3.2.2.4.5. Predicción con tres categorías Así pues, todo parecía indicar que la información de la que disponíamos sólo podría ser útil para distinguir entre bajas breves y prolongadas, pero no para dar una estimación precisa. No obstante y como solución intermedia, probamos a introducir un nuevo punto de corte por encima de los 15 días de baja (1 mes, 2, meses, tres meses, etc.) y comprobar nuestra capacidad de predicción categórica. En principio probamos mediante un modelo logístico multinomial. En tal caso, el problema consistía en ensayar con diferentes puntos de cortes para poner a prueba la aptitud de los datos a la hora de detectar la respuesta. En la práctica, el algoritmo de la regresión logística multinomial se mostró demasiado inestable ante semejante cantidad de datos y de fuentes de variabilidad, por lo que nos vimos obligado a desechar esta opción a favor del árbol de decisión, que admitía sin problemas la inclusión de variables categóricas no dicotómicas. Lo primero que constatamos es que el método (para tres categorías) tenía mucha dificultadas para detectar bajas muy largas. De hecho, sólo detectaba un 16.1% de las bajas superiores a tres meses y, a partir de ahí, las probabilidades caen a cero. Esto volvió a confirmarnos que no contábamos con la información necesaria para identificar a los pacientes cuyas bajas serán muy largas. Tampoco fue capaz de distinguir bajas de entre 15 días y un mes. Así pues, de establecer un nuevo punto de corte, debería estar en torno a los 2 meses de baja. Por ello, procedimos a ensayar con los puntos de corte 40, 45, 50, 55, 60, 65, 70, 75 y 80 para encontrar las mejores probabilidades de acierto. Destacamos que en todos los casos se obtuvo una proporción global de acierto en torno al 78%, aunque el algoritmo mostró una máxima sensibilidad para diferenciar entre bajas de duración media o alta cuando se estableció el punto de corte de 80 días, según se aprecia en la tabla 3.4. En todo caso, consideramos que las proporciones de bajas de duración media o alta reconocidas por el modelo son bajas, es decir, que el modelo no es capaz de distinguir satisfactoriamente entre tres categorías. 45 Clasificación Pronosticado Porcentaje Observado <15 15-80 >80 correcto <15 241557 14392 579 94,2% 15-64 33203 38895 7305 49,0% >65 6900 16884 10361 30,3% Porcentaje global 76,1% 19,0% 4,9% 78,6% Métodos de crecimiento: CRT Variable dependiente: Tiempo_80 Tabla 3.4. Sensibilidad del punto de corte 80 días en árbol de decisión 3.2.3. Conclusión: modelo predictivo a considerar y variables de interés (paso nº3) Como ya hemos comentado, el resultado obtenido por el árbol de decisión con la muestra de validación fue levemente mejor que el de la regresión logística. En relación con este último, apreciamos además como ventaja que el algoritmo del diagrama de árbol fue más similar al típico protocolo médico que el de la regresión logística, basado en una ecuación. Todo ello y a la vista de los resultados obtenidos nos condujo a aplicar un algoritmo de árbol de decisión, a nuestros datos, considerando las variables RDGT, CUENTA, PAGO, TRAMEPI, OCUPACION, TRAMEDAD, FUMADICO, CODGTdico, HIJOSDICO, Rprov, CONTRAT1, RECAIDA ,SEX y ECIVIL, para pronosticar si la duración de la baja sería superior a los 15 días. Tras ensayar con las diferentes opciones que ofrece SPSS para ejecutar el árbol de decisión, optamos por el método CRT con índice de impureza de Gini, una profundidad máxima permitida de 10 ramificaciones y un coeficiente de poda de 0.5. (Tabla 3.5). 46 TREE Real15 [n] BY RDGT CUENTA PAGO TRAMEPI OCUPACION TRAMEDAD FUMADICO CODGTdico HIJOSDICO Rprov CONTRAT1 RECAIDA SEX ECIVIL /TREE DISPLAY=TOPDOWN NODES=STATISTICS BRANCHSTATISTICS=YES NODEDEFS=YES SCALE=AUTO /DEPCATEGORIES USEVALUES=[1 2] /PRINT MODELSUMMARY CLASSIFICATION RISK /SAVE PREDVAL PREDPROB /METHOD TYPE=CRT MAXSURROGATES=AUTO PRUNE=SE(0.5) /GROWTHLIMIT MAXDEPTH=10 MINPARENTSIZE=100 MINCHILDSIZE=50 /VALIDATION TYPE=SPLITSAMPLE(70) OUTPUT=BOTHSAMPLES /CRT IMPURITY=GINI MINIMPROVEMENT=0.0001 /COSTS EQUAL /PRIORS FROMDATA ADJUST=NO /MISSING NOMINALMISSING=MISSING. Tabla 3.5. Sintaxis SPSS del algoritmo de decisión Para valorar la importancia de cada variable en el modelo predictivo pudimos basarnos en el gráfico 3.9, resultado de cuantificar el grado de participación de cada variable predictiva en la reducción del índice de Gini a lo largo y ancho del árbol de decisión obtenido. No obstante, encontramos una clara similitud entre las conclusiones que aportan el gráfico 3.9 y la columna de tamaños de los efectos (eta cuadrado parcial) en la tabla 3.1 Así pues, teniendo en cuenta dicho gráfico, la lista de variables que intervienen de manera efectiva en la toma de decisión, por orden de importancia, fue la siguiente: diagnóstico, pago, cuenta, estado civil, hijos, codiagnóstico, ocupación, edad, provincia, fumador y sexo. El resto de variables resultaron de poco interés en este estudio. 47 Gráfico 3.9. Importancia normalizada de las variables del modelo 48 4. RESULTADOS En el Anexo III se adjunta el gráfico del algoritmo de decisión y podemos apreciar la importancia de las variables en dicho algoritmo. A continuación describiremos de manera pormenorizada la influencia de dichas variables, en orden de importancia, en la duración real de la baja. Estas variables serán estudiadas de manera conjunta cuando apreciemos un considerable tamaño del efecto en la interacción entre ellas, según se refleja en la tabla nº 3.1. Consideramos que los resultados del estudio descriptivo que exponemos a continuación pueden ser en buena medida extrapoladas al global de la población dado el gran tamaño de la muestra. El promedio de días de duración de los procesos se sitúa en 26,14 días con una mediana de 7 días. Esto traduce que la mayoría de los procesos duran menos de 15 días tal y como muestra la tabla 4.1. Tabla 4.1. Distribución de las frecuencias de los tramos de duración de los procesos 49 4.1. Diagnóstico La distribución de los diagnósticos en función de su frecuencia podemos observarla en la tabla 4.2. % del N de la Recuento tabla LUMBALGIA 48933 13,2% GASTROENTERITIS 40780 11,0% FARINGITIS AGUDA 29449 8,0% RESFRIADO COMUN 26171 7,1% GRIPE 24169 6,5% LIUMBOCIATICA 21801 5,9% ANSIEDAD 19857 5,4% CERVICALGIA 17886 4,8% AMIGDALITIS AGUDA 16373 4,4% 16342 4,4% 11482 3,1% GASTOENTERITIS NO INFECCIOSAS BRONQUITIS ANGINA STRP 10374 2,8% VERTIGO Y MAREOS 9379 2,5% COLICO RENAL 7850 2,1% 7137 1,9% GRIPE OTRAS MANIFEST RESP AMENAZA DE ABORTO 6986 1,9% ESGUINCE TOBILLO 6571 1,8% DEPRESION 6437 1,7% HERNIA INGUINAL 6044 1,6% ESGUINCE CERVICAL 4156 1,1% DORSALGIA 4144 1,1% DIARREA 3909 1,1% TUNEL CARPIANO 3859 1,0% 3822 1,0% 3622 1,0% 3461 ,9% 3202 ,9% 3079 ,8% 2801 ,8% 0 ,0% OTRAS COMPLIC. ESP EMBARAZO CEFALEA BRONQUITIS NO AGUDA NO CRONICA MIGRAÑA REACCIÓN ADAPTACIÓN MENISCOPATIA INTERNA PERDIDOS Tabla 4.2. Distribución de las frecuencias de los diagnósticos de los procesos 50 La lumbalgia se presenta como el diagnóstico más frecuente con 13,2% de los casos. La patología osteomuscular es una de las causas más frecuentes de IT en la población general seguida de las enfermedades infecciosas. Al realizar un estudio descriptivo de los diagnósticos según su duración tal y como figura en la tabla 4.3, tenemos: Descriptivos Estadístico Intervalo de confianza para la dIAGNOSTICO DIASBAJA LUMBALGIA Media Límite inferior Percentiles Límite superior Mediana Desv. típ. Amplitud intercuartil 25 50 6,00 15,00 75 43,00 35,18 34,74 35,63 15,00 49,863 37 GASTROENTERITIS 3,83 3,75 3,91 3,00 8,041 3 1,00 3,00 4,00 FARINGITIS AGUDA 4,79 4,70 4,89 3,00 8,299 3 2,00 3,00 5,00 RESFRIADO COMUN 5,44 5,33 5,55 4,00 9,015 4 2,00 4,00 6,00 69 11,00 32,00 80,00 LIUMBOCIATICA 59,89 58,93 60,84 32,00 71,947 6,30 6,21 6,40 5,00 7,547 ANSIEDAD 61,81 60,78 62,84 32,00 73,940 73 11,00 32,00 84,00 CERVICALGIA 50,47 49,62 51,32 31,00 58,000 63 9,00 31,00 72,00 GASTOENTERITIS NO INFECCIOSAS 4,54 4,36 4,71 3,00 11,536 2 ESGUINCE TOBILLO 24,11 23,36 24,85 15,00 30,704 18 GRIPE BRONQUITIS 11,71 11,34 12,09 8,00 20,571 ANGINA STRP 4,79 4,68 4,90 4,00 5,726 5 3,00 2,00 5,00 8,00 3,00 4,00 9,00 15,00 27,00 8 4,00 8,00 12,00 4 2,00 4,00 6,00 VERTIGO Y MAREOS 24,71 23,76 25,66 8,00 46,823 17 3,00 8,00 20,00 COLICO RENAL 19,99 19,19 20,79 8,00 35,974 14 4,00 8,00 18,00 4 4,00 5,00 8,00 82 15,00 38,00 97,00 GRIPE OTRAS MANIFEST RESP AMENAZA DE ABORTO 6,56 6,38 6,74 5,00 7,737 68,98 67,28 70,67 38,00 72,291 DEPRESION 82,39 80,26 84,52 49,00 87,094 HERNIA INGUINAL 52,75 51,71 53,80 43,00 41,451 27 32,00 43,00 ESGUINCE CERVICAL 61,11 59,58 62,63 50,00 50,209 59 25,00 50,00 84,00 DORSALGIA 32,13 30,62 33,65 11,00 49,758 35 4,00 11,00 39,00 DIARREA 107 15,00 49,00 121,50 6,39 5,78 7,00 3,00 19,389 3,00 5,00 TUNEL CARPIANO 78,04 75,92 80,17 57,00 67,242 60 35,00 57,00 95,00 OTRAS COMPLIC. ESP EMBARAZO 58,16 56,68 59,64 46,00 46,611 47 27,00 46,00 74,00 CEFALEA 17,80 16,49 19,11 4,00 40,210 11 1,00 4,00 12,00 7,00 11,00 2,00 6,00 BRONQUITIS NO AGUDA NO CRONICA MIGRAÑA 3 2,00 59,00 10,77 10,09 11,46 7,00 20,551 7 4,00 10,79 9,74 11,83 2,00 30,138 5 1,00 REACCIÓN ADAPTACIÓN 106,99 103,93 110,05 82,00 86,625 112 40,00 82,00 152,00 MENISCOPATIA INTERNA 90,23 87,43 93,03 64,00 75,620 83 37,00 64,00 120,00 5,37 5,27 5,47 4,00 6,489 AMIGDALITIS AGUDA 3 3,00 4,00 Tabla 4.3. Distribución de la duración de los procesos según diagnóstico 51 6,00 4.2. Cuenta Otra variable de interés es el tipo de cuenta del trabajador. El 93,2 % de los trabajadores pertenecen a la cuenta ajena mientras que sólo el 6,8% pertenecen a la cuenta propia (autónomos). La duración agregada de los procesos en función de esta variable es significativa, siendo de 22,59 días para la cuenta ajena y de 66,07 días para la cuenta propia tal y como figura en la tabla 4.4. Tabla 4.4. Distribución de la duración de los procesos según la cuenta Al segregar por diagnóstico se siguen manteniendo estas diferencias como vemos en la tabla 4.5. 52 Tabla 4.5. : Distribución de la duración de los diagnósticos según la cuenta 4.3. Pago Mostramos en la tabla 4.6 una descripción de la duración de los diagnósticos en función del tipo de pago: 53 Tabla 4.6. : Distribución de la duración de los diagnósticos según el tipo de pago 4.4. Ocupación La ocupación más frecuente es la de servicios, restauración y protección (5,8%) seguidos de Técnicos y profesionales de apoyo (4,8%) y trabajadores no cualificados (4,7%). Las duraciones medias por ocupación se muestran en el gráfico 4.1. Gráfico 4.1. Duraciones medias de los diagnósticos según la ocupación 54 En las tablas 4.7 y 4.8 se detallan las duraciones por ocupación segregando por diagnósticos. Observamos como en las fuerzas armadas los diagnósticos que más duran son los relacionados con la patología mental, al igual que ocurre en directivos, científicos e intelectuales, técnicos y profesionales de apoyo, administrativos, construcción, operadores y trabajadores no cualificados. La patología osteomuscular tiene mayor duración ocupaciones relacionadas con agricultura y pesca. La patología infecciosa es la de menor duración en todas las ocupaciones. Media OCUPACION FUERZAS ARMADAS DIRECCION EMPRESAS TECNICOS Y CIENTIFICOS E PROFESIONALES EMPLEADOS INTELECTUALES DE APOYO ADMINISTRATIVOS LUMBALGIA 30,74 63,12 36,75 40,86 GASTROENTERITIS 20,17 4,71 4,78 4,75 3,74 FARINGITIS AGUDA 8,40 7,82 5,83 5,85 5,18 RESFRIADO COMUN 10,00 11,08 6,47 6,62 5,75 LIUMBOCIATICA 81,73 90,31 56,67 62,54 52,62 GRIPE 34,98 7,44 9,39 6,68 6,49 7,41 ANSIEDAD 86,75 92,81 70,12 73,89 65,80 CERVICALGIA 87,00 76,30 42,31 55,56 46,89 GASTOENTERITIS NO INFECCIOSAS 2,00 4,36 5,43 5,29 4,52 ESGUINCE TOBILLO 27,50 43,42 30,24 30,88 25,66 BRONQUITIS 37,14 21,05 13,60 13,19 11,22 ANGINA STRP 23,00 3,72 4,60 5,33 5,68 VERTIGO Y MAREOS 34,00 59,22 26,95 33,67 25,25 COLICO RENAL 51,00 22,15 19,96 22,93 20,00 7,57 6,63 7,44 6,89 GRIPE OTRAS MANIFEST RESP AMENAZA DE ABORTO DEPRESION HERNIA INGUINAL 43,00 79,11 70,00 63,71 65,66 115,50 116,05 84,58 95,31 88,28 43,80 53,63 38,96 41,29 37,43 108,00 73,58 58,19 59,43 60,08 DORSALGIA 61,53 30,38 44,32 21,57 DIARREA 21,00 6,70 8,54 7,96 197,33 80,52 58,68 66,90 63,69 OTRAS COMPLIC. ESP EMBARAZO 98,00 51,32 54,94 54,79 62,92 CEFALEA 42,00 48,40 26,54 25,16 16,59 8,00 10,94 9,75 10,77 11,15 ESGUINCE CERVICAL TUNEL CARPIANO BRONQUITIS NO AGUDA NO CRONICA MIGRAÑA REACCIÓN ADAPTACIÓN MENISCOPATIA INTERNA AMIGDALITIS AGUDA Total 118,00 32,00 20,68 15,03 10,10 296,00 149,91 98,44 117,38 103,36 73,20 84,92 60,40 79,97 61,65 8,00 7,76 7,06 5,87 5,87 55,56 62,94 32,59 34,79 28,39 Tabla 4.7. Distribución de la duración de los diagnósticos según ocupación (I) 55 Media OCUPACION SERVICIOS RESTAURACION Y PROTECCION LUMBALGIA MANUFACTURAS, AGRICULATURA CONSTRUCCION OPERADORES Y Y PESCA Y MINERIA MONTADORES TRABAJADORES NO CUALIFICADOS PERDIDOS 43,24 51,82 41,96 37,03 42,12 32,29 GASTROENTERITIS 4,62 3,31 4,46 4,02 4,70 3,65 FARINGITIS AGUDA 5,92 3,84 5,22 4,96 5,09 4,59 RESFRIADO COMUN 7,00 4,59 5,45 5,24 5,91 5,19 67,63 75,48 71,63 70,69 71,35 56,12 LIUMBOCIATICA GRIPE 7,04 7,54 6,14 6,41 6,89 6,17 ANSIEDAD 72,58 65,47 70,97 67,50 71,58 56,13 CERVICALGIA 52,53 68,19 57,39 52,06 57,19 48,30 GASTOENTERITIS NO INFECCIOSAS 5,28 9,80 4,59 4,60 4,76 4,36 ESGUINCE TOBILLO 28,07 41,43 26,71 26,19 33,13 21,01 BRONQUITIS 14,59 21,02 12,01 13,09 15,76 10,82 ANGINA STRP 5,57 4,46 5,22 6,05 5,88 4,63 VERTIGO Y MAREOS 28,55 19,82 31,15 34,00 35,15 21,68 COLICO RENAL 24,50 38,68 24,55 23,18 20,45 18,77 GRIPE OTRAS MANIFEST RESP 7,65 7,95 6,73 6,80 6,28 6,39 67,45 AMENAZA DE ABORTO 78,98 62,71 84,17 59,77 91,89 DEPRESION 96,92 114,00 88,95 91,64 98,38 75,54 HERNIA INGUINAL 50,50 52,28 60,72 53,78 57,45 52,73 ESGUINCE CERVICAL 63,21 69,69 59,14 62,83 62,14 60,60 DORSALGIA 29,31 55,67 40,59 38,63 37,20 30,13 6,50 8,58 6,70 6,90 5,40 6,12 TUNEL CARPIANO 81,94 77,77 84,28 76,09 80,36 78,02 OTRAS COMPLIC. ESP EMBARAZO 74,75 165,00 73,24 77,00 77,76 55,59 CEFALEA 22,68 3,89 20,22 23,42 20,40 16,04 BRONQUITIS NO AGUDA NO CRONICA 16,45 17,17 12,58 16,82 13,39 9,71 MIGRAÑA 13,66 11,79 12,74 16,55 14,93 9,36 97,59 63,75 109,23 120,86 102,88 106,47 96,73 152,67 100,69 99,04 99,72 89,74 6,15 5,39 5,56 5,61 6,04 5,18 35,95 36,36 31,89 28,98 33,02 23,08 DIARREA REACCIÓN ADAPTACIÓN MENISCOPATIA INTERNA AMIGDALITIS AGUDA Total Tabla 4.8. Distribución de la duración de los diagnósticos según ocupación (II) 4.5. Edad De los procesos estudiados el tramo de edad más frecuente en los hombres se da entre los 43 y 51 años a diferencia de las mujeres que son entre los 32 y 37 años. 56 En la tabla 4.9 se muestra el promedio de duración de días en baja por tramo de edad de manera agregada. Es el tramo de más de 52 años el que presenta una duración media mayor. Tabla 4.9. Distribución de la duración de los procesos según el tramo de edad Al exponer los resultados segregados por diagnósticos observamos igual comportamiento tanto en medias como en medianas de duración tal y como aparece en la tabla 4.10. Tabla 4.10. Distribución de la duración de los diagnósticos según el tramo de edad 57 Si tenemos en cuenta el año en el que se produce el periodo de incapacidad y tal y como se muestra en la tabla 4.11 observamos que, conforme van pasando los años, el tramo de edad se va rejuveneciendo de 2008 a 2012, siendo el tramo de 43 a 51 años el más frecuente en 2008 y el de menos de 31 en 2012. AÑO TRAMEDAD 2008 2009 2010 2011 2012 % de la fila % de la fila % de la fila % de la fila % de la fila <= 31 17,7% 19,3% 20,9% 23,2% 18,9% 32 – 37 17,9% 19,6% 21,4% 22,6% 18,5% 38 – 42 19,1% 20,5% 21,3% 22,0% 17,2% 43 – 51 19,4% 21,1% 20,9% 21,5% 17,2% 52+ 21,0% 21,0% 21,4% 20,5% 16,1% Tabla 4.11. Evolución de la frecuencia de los tramos de edad en el periodo 2008-2012 4.6. Codiagnóstico En la tabla 4.12 se muestra la diferencia entre duraciones de los procesos que si tienen codiagnóstico y los que no: Tabla 4.12. Distribución de la duración de los procesos según el codiagnóstico El codiagnóstico influye claramente en la duración de los procesos tal y como podemos observar en el gráfico 4.2, donde podemos apreciar que el efecto del 58 codiagnóstico sobre el aumento de la duración de los procesos es más patente en las enfermedades infecciosas. Gráfico 4.2. Duraciones medias de los diagnósticos según la presencia de codiagnóstico 4.7. Hijos Otra de las variables que explican la varianza de la duración de los procesos es la de tener o no tener hijos. En el primer caso la duración media es de 48,61 días de forma agregada mientras que los que no tienen hijos tiene una duración de 26,29 días. Destaca la diferencia en días medios de duración situación que se mantiene al tener en cuenta las medianas de duración (tabla 4.13). 59 Tabla nº 4.13. Distribución de la duración de los procesos según la descendencia Al segregar esta variable por diagnóstico sigue siendo la duración media y mediana más elevada en todos los diagnósticos de registros que si tienen hijos, tabla nº 4.14. Tabla 4.14. Distribución de la duración de los procesos según la descendencia 60 Al segregar por sexo, las mujeres que si tienen descendencia tienen una duración media agregada de 51,49 días frente a los 45,38 días de los hombres. 4.8. Provincia La provincia de origen de los registros también influye en la duración de los procesos, se optó por realizar un clúster con todas las provincias agrupándose en cuatro conjuntos: En el grupo nº 1(8,9% del total de registros) están: Almería, Badajoz, Cáceres, León, Lugo, Orense, Pontevedra, Salamanca, Valencia y Zamora. En el grupo nº2 (35,4% del total de registros) están: Albacete, Alicante, Asturias, Ávila, Castellón, Ciudad Real, Córdoba, Cuenca, Granada, Guipúzcoa, Huelva, Jaén, La Coruña, Vigo, Murcia, Palencia, Sevilla, Tenerife, Teruel y Vizcaya. En el grupo nº 3(19,9% del total de registros) están: Baleares, Burgos, Cádiz, Cantabria, Gerona, Huesca, Las Palmas, Lérida, Málaga, Melilla, Segovia, Soria, Toledo y Valladolid Y en el grupo nº4(35,9% del total de registros): Álava, Barcelona, Ceuta, Guadalajara, La Rioja, Madrid, Navarra, Tarragona y Zaragoza. Las duraciones por grupo se muestran en la tabla 4.15 61 Tabla 4.15. Distribución de la duración de los procesos según la provincia de origen Al segregar las duraciones por tramos de duración en relación al clúster de provincias tenemos comportamiento muy similar a diferencia del grupo n4, que es el único grupo donde la duración más frecuente es en el tramo menor de 15 días. En la tabla 4.16 se observa el resto de datos. Tabla 4.16. Distribución de la frecuencia de los tramos de duración según la provincia de origen 62 4.9. Tipo de contrato La duración de los procesos en función del tipo de contrato según sea a tiempo parcial o a tiempo completo se muestra en la tabla 4.17. Tabla 4.17. Distribución de la duración de los procesos según el tipo de contrato Llama la atención el hecho de que los registros que tiene un contrato a tiempo parcial tienen más duración que los que lo tienen a tiempo completo. La mayor desviación en cuanto a duraciones se da en las patologías relacionadas con la esfera mental según se muestra en la tabla 4.18. 63 Tabla 4.18. Distribución de la duración de los diagnósticos según el tipo de contrato 4.10. Recaída El 29,1 % de los procesos han tenido recaída de su patología siendo en las mujeres más frecuente la recaída (15,4%) que en los hombres (13,9%). 64 En la tabla 4.19 se muestran las duraciones medias en el caso de haber o no tenido recaída: Tabla 4.19. Distribución de la duración de los procesos según la recaída Sólo en los casos con diagnósticos de hernia inguinal y en otras complicaciones del embarazo la duración media de los procesos es menor en el caso de no haber tenido recaída previa. 4.11. Estado civil El estado civil juega también un papel en la duración de los procesos de IT. En la tabla 4.20 se muestra como los pacientes con estado civil viudo son los que tienen mayores duraciones probablemente vinculado a la edad, seguido por los pacientes divorciados y las parejas de hecho: Tabla 4.20. Distribución de la duración de los procesos según el estado civil Son las casadas, mujeres en pareja de hecho y solteras las que tienen mayores duraciones medias a diferencia de los viudos. En el caso de los 65 divorciados y divorciadas las duraciones son similares: 49,09 días para los primeros y 49,01 para las segundas. 4.12. Interacción diagnóstico - sexo Las mujeres presentan las duraciones medias y medianas mayores. Hay diferencia entre las duración de los proceso entre hombres y mujeres tal y como podemos ver en la tabla 4.21. Tabla 4.21. Distribución de la duración de los procesos según el sexo En cuanto a la duración de los procesos detectamos diferencias según el sexo. El tramo de duración inferior a 15 días es el más frecuente en ambos sexos aunque en mayor medida para los hombres. El segundo tramo más frecuente es el de 31 a 60 días en ambos sexos. Tabla 4.22. Tabla 4.22. Distribución de la frecuencia de los tramos de duración según el sexo 66 La distribución por sexos según el tramo de edad se muestra en la tabla 4.23. SEX TRAMEDAD H M % del N total de % del N total de % de la fila tabla % de la fila tabla <= 31 49,5% 11,7% 50,5% 12,0% 32 - 37 44,0% 11,0% 56,0% 14,0% 38 - 42 48,2% 8,2% 51,8% 8,8% 43 - 51 53,4% 9,9% 46,6% 8,7% 52+ 57,2% 8,7% 42,8% 6,5% Tabla 4.23. Distribución del género según el tramo de Edad En relación a la distribución de diagnósticos por sexos tenemos que la lumbalgia es el diagnóstico más frecuente. La lumbalgia es más frecuente entre las mujeres con un 7,1 % frente a un 6,1 % de los hombres. En la tabla 4.24 podemos observar el comportamiento en todos los diagnósticos. 67 Tabla 4.24. Distribución de la frecuencia de los diagnósticos según el sexo 4.13. Interacción diagnóstico - tipo de pago Dado que la interacción entre el diagnóstico y el pago es una fuente de variabilidad a tener en cuenta se muestra en la tabla 4.25 las duraciones medias y medianas en función de estas dos variables: 68 Tabla 4.25. Distribución de la duración de los diagnósticos según el tipo de Pago En el gráfico 4.3 se pone de manifiesto esta variabilidad que sigue manteniéndose al tener en cuenta los tramos de duración de los procesos en función del tipo de pago. Se observa cómo la mayor parte de los procesos se encuentran en el tramo de menor duración y éste es mayoritario en el pago delegado, al contrario que en el pago directo donde es el tramo de 31-60 días el más frecuente. 69 Gráfico 4.3. Distribución de los tramos de duración de loa procesos según el tipo de Pago Como se puede observar en la tabla 4.26, el tipo de pago delegado es el más frecuente en todos los diagnósticos. 70 Tabla 4.26. Distribución de la frecuencia de los diagnósticos según el tipo de pago Al segregar por tipo de pago llama la atención el comportamiento de la frecuencia de la lumbalgia que representa el 21,8% de los casos. 71 4.14. Interacción Número episodio - hábito tabáquico Los pacientes que tienen hábito tabáquico tienen mayores duraciones medias y menores duraciones medianas frente a los que no lo tienen (tabla 4.27). Tabla 4.27. Distribución de la duración de los diagnósticos según el hábito tabáquico La distribución de las duraciones teniendo en cuenta el número de episodio del trabajador y su hábito tabáquico la podemos observar en la tabla 4.28: 72 Tabla 4.28. Distribución de la duración de los procesos en función del número de episodio y del hábito tabáquico En los casos que hayan tenido un episodio de IT y de dos a tres, tanto las duraciones medias como medianas son superiores en el caso de los fumadores. Esta situación se invierte cuando los casos tengan de cuatro a siete episodios o más de siete. 73 5. DISCUSIÓN No cabe duda que hay muchos factores que influyen en las duración de los procesos que no hemos incluido debido a su difícil manejo o medida, tal y como expone Castejón22. Al clasificar los factores que influyen en la historia natural de la IT podemos hablar de: 1. Factores Biológicos propios de individuo (edad, sexo, estado civil, etc.) 2. Factores Biológicos propios de la patología(diagnostico, comorbolidad, hábitos, vivencia de la enfermedad en la sociedad del bienestar, etc.) 3. Factores Sociales (estilo de vida, carga familiar, nivel cultural, inmigración, lugar de residencia, etc.) 4. Factores Profesionales (Tamaño empresa, jornada laboral, cargas, prevención, clima laboral, grado de satisfacción, etc.) 5. Factores Económicos (Nivel de renta, régimen de Seguridad social) 6. Factores Sanitarios (Características del médico evaluador, accesibilidad al sistema sanitario, etc.) Es evidente la dificultad de medida de muchos de ellos y consecuentemente la imposibilidad de incluirlos en nuestro modelo. En primera instancia y la vista del Gráfico 1.2. donde se pueden ver las duraciones medias de los periodos de IT del INSS, ISM y MUCOSS en el periodo 2007-2012 observamos claras diferencias. La menor duración de los procesos en las MUCOOS puede tener varios motivos. Los médicos evaluadores de la capacidad laboral en las mutuas tienen una dedicación exclusiva en este cometido a diferencia de los médicos de atención primaria, hecho que puede influir en los tiempos medios de duración. Por otro lado en las mutuas se reducen los tiempos de gestión a la hora de realizar pruebas y/o 22 Castejón J. et al. La Incapacitat Laboral per Coningencias Comunes en Catalunya. Barcelona: Consell de Treball, Economic i Social de Catalunya. 2003 74 tratamientos, hecho que se alarga más en atención primaria. Podemos hablar de una mayor especialización como médico evaluador en los profesionales pertenecientes a las mutuas e INSS. No cabe duda de que existen más causas que expliquen estas diferencias pero obviamente no son objeto de este trabajo. Por otro lado hay que destacar el papel del cambio de ciclo económico de la crisis española que comenzó en el 2008 sobre la IT. Al tener en cuenta la tasa de absentismo laboral23, es decir, porcentaje de la población que está en situación de IT, y las jornadas perdidas por trabajador, tenemos que durante la época de crisis ambos indicadores han disminuido. Frente a lo anterior hay un dato muy llamativo: las duraciones medias de los procesos durante estos años se han mantenido en cifras similares. Esto implica que la crisis no ha producido sesgo importante sobre nuestro modelo de predicción. Tal y como se ha expuesto en los resultados la variable con más peso a la hora de explicar la varianza de la duración de los procesos de IT es el diagnóstico. Este hecho está en consonancia con otros estudios como los realizados por Juan Luis Cabanillas24 y Esther Álvarez25. En sentido contrario tenemos estudios26 que dan una importancia secundaria al diagnóstico dentro de la historia natural del proceso de IT sin entrar en análisis estadísticos posteriores. No siendo el objetivo de estos estudios el desarrollar un modelo predictivo de duración estamos en completo desacuerdo el considerar el diagnostico como factor secundario a la hora de determinar la duración de un proceso de IT a la vista de los resultados expuestos previamente. 23 Adecco (internet). Madrid. 7 de agosto 2016. Disponible en www.adecco.es 24 Cabanillas J.L. et al. Tiempos óptimos personalizados en Incapacidad temporal. Consejería de Salud y Bienestar Social de la Junta de Andalucía. Sevilla;2012 25 Álvarez Theurer E. et al. Análisis de la duración de los periodos de incapacidad temporal de los procesos de Andalucía. Factores asociados. Aten. Primaria:2009;41 (7):387-393 26 Villaplana García M.A. .El Absentismo laboral por Incapacidad Temporal derivada de Contingencia Comunes en el periodo 2005-2010. Tesis Doctoral. Universidad de Murcia. 2012 75 Existen estudios27 28 donde se pone de manifiesto la importancia del diagnóstico en la duración de los procesos no teniendo como objetivo realizar una predicción de duración como el caso que nos trata. En relación a la predicción de duración existe poca bibliografía que aborde el tema que nos ocupa explicado en parte por la dificultad que ello conlleva. Hay muchos trabajos que analizan factores de corrección29 30 31 32 que influyen en la duración de los procesos pero sin entrar en diagnósticos. E. Álvarez33 a través de una regresión lineal múltiple tras análisis multivariante desarrolla un modelo pero sólo para el diagnóstico de lumbalgia, hecho fundamentado porque la patología osteomuscular es la más prevalente tal y como se ha puesto de manifiesto en nuestro estudio y otros34. Hay otros autores que van la línea utilizando sólo un diagnóstico (ansiedad) como es el caso de Carlos Catalina y colaboradores35. 27 Allen Cheadle et al. Factor influencing the Duration of Work.Related Disability: A Population Based Sutdy of Washington State Workers Compensation. American Journal of Public health. 1994; 84(2):194 28 González Barcala F.J. et al. Determinantes de la Duración de la Incapacidad temporal y vuelta al trabajo en un área sanitaria de Galicia. Aten. Primaria. 2006;37(8):431-8 29 Bayona X. et al. Variables que influyen en la resolución de una Incapacidad Temporal por contingencia comunes de muy larga duración. Arch. Prev. Riesgos Labor. 2004;7(2):64-69 30 Benavides F.G. et al. Reincorporación al trabajo después de un episodio de Incapacidad temporal por contingencia común: Papel de la edad, el sexo, la actividad económica y la Comunidad Autónoma. Rev. Esp. Salud pública.2007;81:183-190 31 Alavinia S.M. Determinats of works ability and its predictive value for diasability. Occupational Medicine. 2009;59:32-37 32 Villaplana M. Grado de efecto de las variables sociodemográficas, laborales, organizativas y del entorno en la duración de la Incapacidad Temporal por contingencias comunes en España. Aten. Primaria. 2015;47(2):90-98 33 Álvarez Theurer et al. Modelo Predictivo de la duración de Incapacidad temporal por Lumbalgia. Factores determinantes. 2005;14(3):10-17 34 Delclos J. et al. Duración de la Incapacidad temporal por contingencia común por grupos diagnósticos. Arch. Prev. Riesgos labor. 2010; 13(4):180-187 35 Catalina C. et al. Predictores de la duración de Incapacidad Temporal por Contingencias comunes en los Trastornos de Ansiedad. Gaceta Sanitaria. 2011;27(1):40-46 76 Desde un punto de vista antropológico el diagnóstico médico es la vivencia de la enfermedad en el sujeto y entramos en lo que Laplantin36 denomina el “campo del enfermo “que se caracteriza por el sufrimiento y la conciencia de la experiencia mórbida; es fácil de entender la gran variabilidad interindividual y su repercusión sobre el tiempo de recuperación. No podemos obviar los efectos de la sociedad del bienestar donde cada vez se objetiva mejor como patologías o enfermedades banales representan un sufrimiento mayor en la población no justificado por la entidad clínica de la patología. Junto a esta variabilidad y tal y como como la antropología sociocultural ha demostrado como expone Guerrero37 en su trabajo, las percepciones de buena y mala salud (enfermedad) se encuentran culturalmente construidas, hecho que complica más aun el desarrollo del modelo, más aun cuando no disponemos de magnitud que pueda ayudar a su medida. En relación con la variable cuenta si hay estudios en concordancia con el nuestro38 39 40. La razón por la cual los procesos de IT duran más en el Régimen Especial de Trabajadores Autónomos que en el Régimen General puede deberse a varios factores como más precariedad laboral, menor control en medidas de protección, existencia de un suplemento en cuotas de cotización para estar protegido en el accidente laboral y el concepto de “prestación refugio”. La prestación por IT tiene como ya se ha expuesto anteriormente una duración máxima de 12 meses, prorrogables 6 meses más si hay estimación de curación o mejoría que permita reanudar la actividad laboral. Posteriormente puede 36 Laplantin F. Antropología de la Enfermedad. Paris:Editions Payot;1965 37 Guerrero F. Salud. Enfermedad y Muerte: Lecturas desde la antropología Sociocultural. Revista Mad.2004;10:1 38 Benavides F.G. et al. Evaluación de la gestión de los casos de Incapacidad Temporal por contingencia común de más de 15 días en Cataluña. Gac. Sanit. 2010; 24(3):215-219 39 Delclos J. et al. Duración de la Incapacidad temporal por contingencia común por grupos diagnósticos. Arch. Prev. Riesgos labor. 2010; 13(4):180-187 40 Royo-Bordonada M.A. La duración de la Incapacidad Laboral y sus factores asociados. Gac. Sanit. 1999;13(3):177-184 77 iniciarse otro proceso de IT por el mismo motivo por una sola vez con derecho a prestación con una duración máxima de 18 meses41. En este sentido la conjunción de situaciones desfavorables como quiebras de empresas, negocios no viables y otras, junto a la existencia inicial de patología que justifique un periodo de IT convierten la prestación por incapacidad en una prestación refugio para no entrar en situación de exclusión social42. Respecto a la variable tipo de pago no encontramos bibliografía relacionada. La mayor duración de los procesos que están en situación de pago directo se debe fundamentalmente al recibir el alta médica y por tanto la finalización de su periodo de incapacidad, dejan de recibir la prestación económica. Aludo al concepto antes expuesto de prestación refugio. La ocupación del trabajador también influye en la duración de los procesos tal y como hemos expuesto y en comparación con otros estudios43 44 45 . La distribución por diagnóstico más prevalente en las ocupaciones va en relación a las cargas laborales (físicas, posturales, mentales y neurosensoriales) de cada profesión. En las profesiones con cargas mentales elevadas muestran más frecuencia de patologías relacionadas con la esfera mental, al revés que ocurre con profesiones menos cualificadas que al tener mayores cargas físicas y posturales tiene más incidencia de patología osteomuscular. No habiéndose tratado en nuestro trabajo es importante comentar el trabajo de Santamaría, P.46 donde pone de relevancia la relación existente entre la simulación de patologías y la profesión del trabajador, hecho que produce un sesgo en la 41 Art. 131 bis del RD Legislativo 1/1994, de 20 de junio, por el que se aprueba el Texto Refundido de la Ley General de seguridad social 42 Arrina, A. El concepto de Exclusión en la Política Social. Trabajo social Hoy. 2002;34:47-46 43 Rivas P. Salud Mental e incapacidad Temporal en población laboral de Cataluña. Arch. Prev. Riesgos Labor. 2008;11(2):81-86 44 García Álvarez, G. Conceptos básicos en incapacidad temporal. Jano. 2003;65(1495):17701773 45 Benavides F.G..Ocuppational categories and sickness absence certified as attributable to common disease. European Journal of Public Health. 2003:13 (1);51-55. 46 Santamaría P. et al. Prevalencia de Simulación en Incapacidad Temporal: Percepción de los profesionales de la Salud. Clínica y Salud. 2013;24:139-151 78 duraciones reales por ocupación. No se ha encontrado bibliografía que pueda aclarar la relación entre la simulación y la mayor duración de los procesos según el tipo de régimen laboral (variable cuenta de nuestro estudio) y la naturaleza del pago de la prestación (variable pago de nuestro estudio). La edad es otra variable que influye en la duración de los procesos de IT y está presente en la mayoría de los estudios previos y otros como, E. Álvarez (2005) y Torá I.47 Como era de esperar la mayor duración de los procesos se encuentra en el tramo de edad superior a 52 años, no sólo por la aparición de patologías propias de ese tramo sino también porque hay una disminución en la capacidad de recuperación frente a otros tramos. Esta realidad hace que desde las administraciones del estado se desarrollen planes para lo que Mauro Brigeiro48 denomina “envejecimiento exitoso”, es decir, conseguir las mejores condiciones socio sanitarias posibles en la etapa final de la vida. A esto habría que sumar otros factores o variables que inciden sobre la ancianidad y la vivencia de la enfermedad como expone Guijarro J. L.49 que influyen sobre la duración de los procesos, como son la invalidez que puede llegar a provocar, amenaza ante la pérdida de integridad del sujeto, etc. No cabe duda que estos factores también influyen en otras edades pero en menor medida. En la tabla 4.11 se observaba como de 2008 a 2012 el tramo de edad de procesos de IT se va rejuveneciendo. Al contrastar estos datos con los porcentajes de población activa sobre población total en España en el mismo periodo y en los mismos tramos de edad, encontramos que el tramo de menos de 31 años es más frecuente en todos los años del periodo50 aunque disminuye en frecuencia año a año a diferencia del resto de tramos que aumenta en meseta ascendente. 47 Tora Rocamora I. et al. Duración de los episodios de Incapacidad temporal por contingencia común según regiones sanitarias en Cataluña. Rev. Esp. Salud Pública. 2010;84(1):61-69 48 Mauro Brigeiro. Envejecimiento exitoso y tercer edad. Problemas y retos para la promoción de la salud. Investigación y Educación en Enfermeria.2005;23 (1):102-109 49 Guijarro J.L.. Las Enfermedades en la Ancianidad. Anales Sis. San. Navarra. 199;2 (1):85-94 50 Instituto Nacional de Estadística (internet). Madrid. Agosto 2015. Disponible en: www.ine.es/welcomo.shtml 79 La existencia de otra patología coexistente con la causa principal de diagnóstico aumenta la duración de los procesos. En la mayoría de la bibliografía revisada no se incluye la existencia o no de más de un diagnóstico en los análisis realizados. Cabanillas J.L.51 introduce esta variable a través del índice de Comorbilidad de Charlson52 que coincide con nuestro estudio al definir la comorbilidad como variable predictora de la duración de los procesos. Llama la atención en los procesos estudiados que en los diagnósticos relacionados con patología infecciosa es donde más influye el hecho de tener o no otro diagnóstico. Esto puede estar causado por la influencia del efecto de este tipo de patologías sobre el estado general del individuo haciendo que la existencia de otro diagnóstico tenga mayor repercusión sobra la capacidad de recuperación. No hemos encontrado bibliografía que trate este aspecto. Coincidiendo con nuestro trabajo tenemos muchos estudios (Álvarez E., Catalina C., Benavides F. G., etc.) que afirman que el hecho de tener o no tener descendencia influye y es determinante en la duración de la IT. Es importante destacar que al segregar por sexo el hecho de tener descendencia alarga más la duración en el caso de las mujeres. La razón de este comportamiento cabe entender que obedece a varias circunstancias como, entre otras, la atribución histórica por un lado del cuidado materno de los hijos y la responsabilidad de la salud familiar por parte de la mujer como exponen Pezo M.C.53 y Hernandez I.54 La provincia de origen tiene también importancia en nuestro modelo predictivo. En otros estudios como los ya mencionados de Álvarez E. (2005), F.G. Benavides (2007) y Villaplana M. (2013) se pone de manifiesto. En el primer 51 Cabanillas Moruno J.L. et al. Tiempos óptimos personalizados en Incapacidad temporal. Consejería de salud y Bienestar social de la Junta de Andalucía. Sevilla. 2012. 52 Charlson M.A. et al. A new Method of Clasifying cognosis comorbidity in longitudinal studies, development and validation. J chronics dis.1987:40;373-83 53 Pezo Silva María Concepción, Souza Praça Neide de, Costa Stefanelli Maguida. La mujer responsable de la salud de la familia: Constatando la universalidad cultural del cuidado. Index Enferm [revista en la Internet]. 2004 Nov [citado 2015 Jul 30] ; 13(46): 13-17. Disponible en: http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S1132-12962004000200003&lng=es. 54 Hernández Tezoquipa I. El cuidado a la salud en el ámbito doméstico. Rev. Saude Pública.2001;35 (5):443-50 80 estudio se hace referencia al origen rural del proceso como explicativo de mayor duración, hecho que está en concordancia con nuestro trabajo aunque no se haya estudiado específicamente de esta manera. González F.J.55 expone igualmente en su estudio similares resultados. En el segundo caso la importancia que se le da a la provincia es menor que en nuestro estudio, esta diferencia puede estar motivada por la agrupación previa por provincias de características similares que realizamos. Las condiciones de accesibilidad al sistema sanitario pueden influir en este aspecto sin olvidar otros determinantes como la mayor añosidad de los colectivos del medio rural. Al igual que Corrales56 el hecho de esta diferencia de duraciones obedece a múltiples factores que bien podían ser objeto de un estudio más pormenorizado. Al igual que Villaplana M. (2013) encontramos que el hecho de tener un trabajo a tiempo completo alarga la duración media de los procesos en similar medida en ambos estudios. Para explicar esta diferencia habría que tener en cuenta la existencia de más factores como la precariedad laboral de los contratos a tiempo parcial, las modificaciones de la Ley de Reforma Laboral y el efecto de la crisis en los diferentes tipos de contrato según sean a tiempo completo o parcial. Los procesos que son recaída de un episodio previo de IT tienen menor duración que los que no lo tienen, salvo en el caso de la hernia inguinal que por su naturaleza quirúrgica presentan una posibilidad de recaída reducida y en los casos de complicaciones del embarazo condicionados por las fechas de parto que implican alta en el proceso de incapacidad y nueva baja por maternidad, encontrando por tanto un sesgo es la duración. El estado civil del trabajador también muestra diferencias en las duraciones que concuerda con otros estudios, Catalina C. (2011), Noceda J.57, Bassols A.58 y 55 González-Barcala F.G. et al. Determinantes de la duración de la incapacidad temporal y la vuelta al trabajo en un área sanitaria de Galicia. Aten. Primaria. 2006;37 (8);431-8 56 Corrales H. et al. La duración de las bajas por accidente laboral en España ¿Se justifican las diferencias entre comunidades autónomas?. Revista de economía laboral. 2008;5:73-98 57 Noceda J.J. Características del dolor Osteomuscular crónico en paciente de Atención Primaria. Resultados de centro rural y otro urbano. Rev. Soc. Ep. Dolor. 2006;5:287-293 81 otros. En los trabajadores viudos la razón de su mayor duración probablemente está ligada a la edad con patología más prevalente y pluripatologia unido a las ciertas situaciones de menor número de familiares convivientes. El hecho de estar soltero muestra en nuestro estudio menor tiempo medio en la duración de los procesos de IT en contraposición al trabajo de Vaquero59 que encuentra mayor duración en las personas que viven sin pareja. Al segregar por sexo, los viudos tienen mayor duración que las viudas probablemente relacionado con el tradicional papel de cuidadora de la familia de la mujer. La diversidad de estudios y de resultados en relación a esta variable traduce la complejidad del manejo y de su explicación. Es evidente que existen factores de difícil mesura que entendemos están en estrecha relación con las condiciones sociales y de vida de cada individuo. En cuanto a la interacción del diagnóstico con el sexo coincidimos con Aurrekoetxea60 en relación a la mayor prevalencia de la patología osteomuscular en ambos sexos y la mayor duración en mujeres. La mayor duración de los procesos en mujeres es una constante en todos los estudios revisados. En el caso de las mujeres es posible que exista un subregistro de los diagnósticos de complicaciones del embarazo por deslizamiento hacia los epígrafes relacionados con patología osteomuscular, es decir, gestantes que tengan diagnóstico de lumbalgia cuando realmente deberían tener el de Otras complicaciones específicas del embarazo. En este sentido llama la atención que en el caso del diagnóstico de lumbociatica es de los pocos que junto a vértigos tienen mayor duración en el sexo masculino. Esta diferencia puede ser explicada por las mayores cargas posturales y físicas en los trabajos en hombres. En el caso de los vértigos aun siendo más frecuente en mujeres dura 58 Bassols A. et al. El dolor de espalda en la población catalana. Prevalencia, características y conducta terapéutica. Gac. Sanit. 2003;17(2):97-107 59 Vaquero M. Factores que influyen en la Incapacidad temporal de larga duración: propuestas de screening y de intervención. Disponible en: http://www.segsocial.es/prdi00/groups/public/documents/binario/168544.pdf. 60 Aurrekoetxea et al. Repetición de los procesos de Incapacidad temporal según diagnóstico. Aten. Primaria. 2009;41(8):439-45 82 más en hombres, sería necesario un análisis más profundo para poder explicar dicha diferencia. Un problema comentado y que puede afectar a más diagnósticos es la calidad del registro de los mismos; hemos encontrado estudios como el de Álvarez Theurer61donde considera aceptable la calidad del diagnóstico de los partes de baja de IT. Otra interacción que demostró importancia en el análisis lineal inicial es entre el diagnóstico y el tipo de pago. La gran diferencia existente puede deberse entre otras causas a lo que ya mencionada anteriormente prestación refugio, que entendemos juega el papel más importante en esta variabilidad. La última variable que explica la duración de los procesos es la interacción entre el número de episodios de cada proceso y el hábito tabáquico. No se ha encontrado bibliografía relacionada. Como cabe esperar el hecho de fumar prolonga la duración media de los procesos, no así la duración mediana. Observamos un comportamiento no esperado al disminuir las duraciones en los fumadores a partir del tercer episodio de IT. Este hecho no puede ser explicado en este análisis debido a no disponer del diagnóstico de cada uno de los episodios de IT previos de cada proceso ni otros factores relacionados con la comorbilidad asociada. En las variables que formaron parte del Anova inicial no se encontraba el sexo salvo en la interacción con el diagnóstico. En el árbol de decisión final el sexo tiene importancia como variable independiente aunque en menor medida que otras. Para intentar saber el porqué de la mayor duración en mujeres habría que revisar el papel de la mujer en la sociedad actual y su evolución histórica. Podemos hablar de una serie de factores que pueden explicar este aumento como el rol de cuidadora en diferentes ámbitos62, menor accesibilidad al 61 Álvarez Theurer E. Medicina del trabajo y calidad del diagnóstico de los procesos causante de Incapacidad Temporal. Med. Segur. Trab. 2009;55(214):72-79 62 García-Calvente, M. et al. El impacto de cuidar en la salud y la calidad de vida de las mujeres. Gac. Sanit. 2004; 18(2):83-92 83 mercado laboral con más precariedad, situaciones de doble jornada de trabajo, es decir, la de la actividad profesional específica y la relacionada con la unidad familiar63 y otras desigualdades sociales que hacen que la mujer esté en peor situación de salud que el hombre64. 63 García, Y. La dualidad del rol de la mujer trabajadora. Colegio Oficial de Psicólogos. Madrid. 1990 64 Borrel C. et al. La Salud pública desde la perspectiva del género y clase social.2004:18(1):2- 6 84 6. CONCLUSIONES El análisis de las frecuencias de las variables estudiadas y la capacidad de explicación de la varianza de la duración de los procesos ha permitido identificar el perfil del trabajador en baja por incapacidad temporal. Las variables que más influyen en el tiempo de duración de los procesos de incapacidad temporal son el diagnóstico, la cuenta, el tipo de pago, la ocupación, la edad, la existencia de codiagnóstico, el hecho de tener o no descendencia, la provincia, el tipo de contrato del trabajador, el hecho de tener recaída o no de un episodio anterior, el estado civil, el tener hábito tabáquico y el sexo. La variable que mejor explica la duración de los procesos en incapacidad temporal es el diagnóstico. Los rangos de duración de los mismos son muy amplios en algunos casos pudiendo atribuirse a falta de cambio de diagnóstico final respecto al inicial y la calidad de la codificación de los mismos. El tipo de pago de cada proceso y la cuenta son la segunda y tercera variable respectivamente que mejor explican la duración. Esto se puede explicar por las repercusiones socioeconómicas que tiene el alta en los dos tipos de pago y cuenta quedando en algunas situaciones el trabajador sin ingresos, una vez finalice su periodo de incapacidad temporal en los casos de pago directo y cuenta propia que cesan actividad. Esto condiciona en parte la duración de cada diagnóstico en función de un tipo de pago u otro. La ocupación también influye en la duración de los procesos habiendo relación entre el tipo de ocupación y las cargas propias de cada una. La edad incrementa la duración de los procesos a medida que aumenta. Este efecto va en relación con el deterioro psicofísico progresivo propio del 85 envejecimiento, que hace que aumenten los periodos de recuperación y a la vez el efecto negativo de la aparición de nuevas patologías ligadas a la edad. La existencia de otro diagnóstico tiene un efecto de incremento en la duración como no podía ser de otra forma. Cabe inferir que esta variable tenga mayor importancia en la duración pudiendo ser objeto de siguientes estudios. El estado civil es la cuarta variable en importancia en cuanto a explicar la duración de los procesos. Parece haber una relación entre la mayor duración en viudos y divorciados, tanto hombres como mujeres, y las intercurrentes dificultades sociales que pueden incidir en estos colectivos. Asimismo el hecho de tener descendencia alarga la duración probablemente relacionado con la atención y cumplimiento de las necesidades y responsabilidades inherentes a la familia y descendencia. El hecho de residir en una u otra provincia tiene un efecto sobre la duración que parece ir más en relación con las diferencias en cuanto a la accesibilidad al sistema sanitario entre el medio rural y urbano. De forma genérica los procesos de incapacidad temporal de trabajadores con contrato a tiempo completo tiene mayor duración que los de tiempo parcial. Los procesos que son recaída de un episodio previo tienen menor duración probablemente relacionado con el alta precoz del primer episodio. La duración de los procesos es mayor en el sexo femenino en todos los diagnósticos. La variabilidad de la duración de los procesos de incapacidad temporal tiene un componente multifactorial que implica un hándicap importante a la hora de realizar una predicción de la misma. Una aproximación válida para este fin se consigue a través de un árbol de decisión que identifica duraciones mayores o menores de 15 días teniendo en cuenta el diagnóstico, el tipo de pago, la cuenta, el estado civil, la existencia o no de descendencia, la existencia o no de codiagnósticos, la ocupación, la edad, la provincia de origen, la existencia o no de hábito tabáquico, el sexo y el considerar recaída o no de episodio anterior. 86 Para conseguir una predicción más precisa sería necesario disponer de más variables no contempladas en este estudio que complementaran los resultados actuales pudiendo ser objeto de trabajos posteriores. El árbol de decisión obtenido es una herramienta útil a efectos de la gestión de la incapacidad temporal en el sistema público de salud permitiendo la planificación y distribución de recursos utilizados en esta prestación. Disponer de un modelo predictivo de la duración de la incapacidad temporal en los procesos derivados de la enfermedad común, mejora la toma de decisiones en todo lo relacionado con la gestión de esta prestación al poder estimar la duración de cada proceso. Esto permite conocer el impacto asistencial y económico derivado de los mismos y consecuentemente desarrollar una planificación estratégica global ajustada a la realidad, sabiendo en el momento de producirse y dependiendo de las variables utilizadas, la duración estimada para cada uno de ellos. 87 7. • BIBLIOGRAFIA Aguado Díaz, Antonio León. Historia de las Deficiencias. Colección Tesis y Praxis. Escuela Libre Editorial, Fundación ONCE. Madrid, España, 1993. • Ahan H. Log-gamma regression modeling through regression tree, Communications in Statistics, Theory an methods. Arkansas: National center for toxicology Research, Food and Drug Administration; 1996 • Alavinia S.M. Determinats of works ability and its predictive value for diasability. Occupational Medicine. 2009;59:32-37 • Álvarez Theurer et al. Modelo Predictivo de la duración de Incapacidad temporal por Lumbalgia. Factores determinantes. 2005;14(3):10-17 • Álvarez Theurer E. Medicina del trabajo y calidad del diagnóstico de los procesos causante de Incapacidad Temporal. Med. Segur. Trab. 2009;55(214):72-79 • Álvarez Theurer E. et al. Analisis de la duración de los periodos de incapacidad temporal de los procesos de Andalucia. Factores asociados. Aten. Primaria:2009;41 (7):387-393 • Allen Cheadle et al. Factor influencing the Duration of Work.Related Disability: A Population Based Sutdy of Washington State Workers Compensation. American Journal of Public health. 1994; 84(2):194 • Arrina, A. El concepto de Exclusión en la Política Social. Trabajo social Hoy. 2002;34:47-46 • Aurrekoetxea et al. Repetición de lso procesos de Incapacidad temporal según diagnóstico. Aten. Primaria. 2009;41(8):439-45 • Bayona X. et al. Variables que influyen en la resolución de una Incapacidad Temporal por contingencia comunes de muy larga duración. Arch. Prev. Riesgos Labor. 2004;7(2):64-69 • Barceló M.A. Modelos Marginales y Condicionales en el Análisis de Supervivencia Multivariante. Gac. Sanit. 2002;16 (2):59-68 88 • Bassols A. et al. El dolor de espalda en la población catalana. Prevalencia, características y conducta terapéutica. Gac. Sanit. 2003;17(2):97-107 • Benavides F.G..Ocuppational categories and sickness absence certified as attributable to comon disease. European journal of Public Health. 2003:13 (1);51-55. • Benavides F.G. et al. Reincorporación al trabajo después de un episodio de Incapacidad Temporal por contingencia común: Papel de la edad, el sexo, la actividad económica y la comunidad autónoma. Rev. Esp. Salud Pública. 2007;81(2):183-190 • Benavides F.G. et al. Evaluación de la gestión de los casos de Incapacidad Temporal por contingencia común de más de 15 días en Cataluña. Gac. Sanit. 2010; 24(3):215-219 • Borrel C. et al. La Salud pública desde la perspectiva del género y clase social.2004:18(1):2-6 • Cabanillas J.L. et al. Tiempos óptimos personalizados en Incapacidad temporal. Consejeria de Salud y Bienestar Social de la Junta de Andalucia. Sevilla;2012 • Castejón J. et al. La Incapacitat Laboral per Coningencias Comunes en Catalunya. Barcelona: Consell de Treball, Economic i Social de Catalunya. 2003 • Catalina C. et al. Predictores de la duración de Incapacidad Temporal por Contingencias comunes en los Trastornos de Ansiedad. Gaceta Sanitaria. 2011;27(1):40-46 • Cermi. (Internet). Madrid: Grupo Editorial Cinca; 2008 (citado 28 agosto 2013).Disponibleen:http://www.cermi.es/esES/ColeccionesCermi/Cermi.es/L ists/Coleccion/Attachments/60/Laimagensocialdelaspersonascondiscapacid ad.pdf • Charlson M.A. et al. A new Method of Clasifying cognosis comorbidity in longitudinal studies, development and validation. J chronics dis.1987:40;373-83 • Corrales H. et al. La duración de las bajas por accidente laboral en España ¿Se justifican las diferencias entre comunidades autónomas?.Revsita de economía laboral. 2008;5:73-98 89 • Datosmacro (internet). Madrid. Abril 2015 (citado el 5 de mayo de 2015). Disponible en: http://www.datosmacro.com/pib/espana • Delclos J. et al. Duración de la Incapacidad temporal por contingencia común por grupos diagnósticos. Arch. Prev. Riesgos labor. 2010; 13(4):180187 • Everitt B., Horton T., An Introduction to Applied Multivariante Analysis with R. Londres: Springer Science+Business Media; 2011. • Freund, Y. and Schapire, R. A decision-theoretic generalization of online learning and an application to boosting. Journal of Computer and System Sciences. 1997: 55;119-139. • García Álvarez, G. Conceptos básicos en incapacidad temporal. Jano. 2003;65(1495):1770-1773 • García-Calvente, M. et al. El impacto de cuidar en la salud y la calidad de vida de las mujeres. Gac. Sanit. 2004; 18(2):83-92 • García, Y. La dualidad del rol de la mujer trabajadora. Colegio Oficial de Psicólogos. Madrid. 1990 • González Barcala F.J. et al. Determinantes de la Duración de la Incapacidad temporal y vuelta al trabajo en un área sanitaria de Galicia. Aten. Primaria. 2006;37(8):431-8 • Guerrero F. Salud. Enfermedad y Muerte: Lecturas desde la antropología Sociocultural. Revista Mad.2004;10:1 • Guijarro J.L.. Las Enfermedades en la Ancianidad. Anales Sis. San. Navarra. 199;2 (1):85-94 • Hastie T., Tibshirani R., Friedman J. The elements of Statistical Learning. 2ª Ed. California: Springer; 2008 • Hernández Tezoquipa I. El cuidado a la salud en el ámbito doméstico. Rev. Saude Pública.2001;35 (5):443-50 • Hosmer D.W. &Lemeshow S..Applied Logistic Regression. 2ª ed. New York .Willey; 1989 • Inzua Canales, Victor. “Una conciencia histórica y la discapacidad”. Revista trabajo social Nueva Época.2001; 3: 77 • Isladelcofre (internet). 2013 (citado21 de agosto 2013). Disponible en: http://www.isladelcofre.com/01normas.htm 90 • James G., Witten D., Hastie T., Tibshirani R. An Introduction to Statistical Learning. Londres: Springer; 2013 • Laplantin F. Antropología de la Enfermedad. Paris:Editions Payot;1965 • Mauro Brigeiro. Envejecimiento exitoso y tercer edad. Problemas y retos para la promoción de la salud. Investigación y Educación en Enfermeria.2005;23 (1):102-109 • Noceda J.J. Características del dolor Osteomuscular crónico en paciente de Atención Primaria. Resultados de centro rural y otro urbano. Rev. Soc. Ep. Dolor. 2006;5:287-293 • Pezo Silva María Concepción, Souza Praça Neide de, Costa Stefanelli Maguida. La mujer responsable de la salud de la familia: Constatando la universalidad cultural del cuidado. Index Enferm [revista en la Internet]. 2004 Nov [citado 2015 Jul 30]; 13(46): 13-17. Disponible en: http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S113212962004000200003&lng=es. • Rawlings, J.O., Pantula S.G., Dickey D.A. Applied Regresion Analysis. 2ª Ed. New York: Springer; 1998 • Rivas P. Salud Mental e incapacidad Temporal en población laboral de Cataluña. Arch. Prev. Riesgos Labor. 2008;11(2):81-86 • Royo-Bordonada M.A. La duración de la Incapacidad Laboral y sus factores asociados. Gac. Sanit. 1999;13(3):177-184 • Santamaria P. et al. Prevalencia de Simulación en Incapacidad Temporal: Percepción de los profesionales de la Salud. Clínica y Salud. 2013;24:139151 • Tora Rocamora I. et al. Duración de los episodios de Incapacidad temporal por contingencia común según regiones sanitarias en Cataluña. Rev. Esp. Salud Pública. 2010;84(1):61-69 • Seg-social:Anexo al informe económico financiero. Presupuestos ejercicio 2012 (internet). Madrid: Seguridad Social; 2012 (citado el 24 de julio 2013 ). Disponible en: http://www.seg-social.es/prdi00/groups/public/ documentos/ binario/169364.pdf • Seg-social (internet). Madrid: Seguridad Social; 2015 (citado el 24 de julio 2013). Disponible en :http://www.segsocial.es/Internet_1/ Estadística/Est/ 91 Otras_Prestaciones_de_la_Seguridad_Social/Incapacidad_Temporal/index. htm • Van Belle G., Fisher L.D., Heagerty P.J., Lumley T. Bioestadistics. A methodology for the Health Sciences. 2ª ed. Wiley ;2004 • Vaquero M. Factores que influyen en la Incapacidad temporal de larga duración: propuestas de secreening y de intervención. Disponible en: http://www.segsocial.es/prdi00/groups/public/documents/binario/168544.pdf. • Villaplana García M.A. .El Absentismo laboral por Incapacidad Temporal derivada de Contingencia Comunes en el periodo 2005-2010. Tesis Doctoral. Universidad de Murcia. 2012 • Villaplana M. Grado de efecto de las variables sociodemográficas, laborales, organizativas y del entorno en la duración de la Incapacidad Temporal por contingencias comunes en España. Aten. Primaria. 2015;47(2):90-98 92 8. ANEXOS 93 ANEXO I. Documento de autorización de Ibermutuamur para el análisis de los datos 94 95 96 97 98 ANEXO II. Distribución de diagnósticos por epígrafe EPIGRAFE GASTROENTERITIS LUMBOCIATICA RESFRIADO COMUN OTRAS GASTROENTERITIS Y COLITIS NO INFECCIOSAS ANSIEDAD ESGUINCE TOBILLO BRONQUITIS MIGRAÑA DEPRESION LUMBALGIA FARINGITIS AGUDA GRIPE CERVICALGIA AMIGDALITIS AGUDA ANGINA ESTREPTOCOCICA VERTIGO Y MAREOS COLICO RENAL GRIPE CON OTRAS MANIFESTACIONES RESPIRATORIAS DIAGNOSTICOS INCLUÍDOS 009.0 722.10 465 009.1 724.3 460 558 558.9 300.0 845.00 466 346.9 300.09 845.0 466.0 346 311 724.2 462 487 723.1 463 300.4 034.0 780.4 788.0 487.1 AMENAZA DE ABORTO 640 HERNIA INGUINAL 550 ESGUINCE CERVICAL 847 DORSALGIA DIARREA SINDROME DEL TUNEL CARPIANO 724.1 787.9 354.0 OTRAS COMPLICACIONES ESPECIFICAS DEL EMBARAZO 646.8 CEFALEA 784.0 BRONQUITIS NO AGUDA NO CRONICA 490 REACCION DE ADAPTACION 309 MENISCOPATIA INTERNA 009.2 836.0 99 293.84 300.02 300.00 346.90 346.1 346.10 346.00 ANEXO III. Algoritmo del árbol de decisión del modelo 100 Real15 Nodo 0 Categoría % n <15 69,3 76691 >15 30,7 34022 Total 100,0 110713 <15 >15 dIAGNOSTICO Mejora=0,163 LUMBALGIA; LIUMBOCIATICA; ANSIEDAD; CERVICALGIA; ESGUINCE TOBILLO; AMENAZA DE ABORTO; DEPRESION; HERNIA INGUINAL; ESGUINCE CERVICAL; DORSALGIA; TUNEL CARPIANO; OTRAS COMPLIC. ESP EMBARAZO; REACCIÓN ADAPTACIÓN; MENISCOPATIA INTERNA Nodo 1 Categoría % <15 36,0 >15 64,0 Total 42,2 GASTROENTERITIS; FARINGITIS AGUDA; RESFRIADO COMUN; GRIPE; GASTOENTERITIS NO INFECCIOSAS; BRONQUITIS; ANGINA STRP; VERTIGO Y MAREOS; COLICO RENAL; GRIPE OTRAS MANIFEST RESP; DIARREA; CEFALEA; BRONQUITIS NO AGUDA NO CRONICA; MIGRAÑA; AMIGDALITIS AGUDA Nodo 2 Categoría % <15 93,6 >15 6,4 Total 57,8 n 16821 29946 46767 PAGO Mejora=0,018 DIRECTO DELEGADO DELEGADO n 16249 21500 Nodo 4 Categoría % <15 6,3 >15 93,7 n 572 8446 Nodo 5 Categoría % <15 94,8 >15 5,2 n 59420 3276 Nodo 6 Categoría % <15 36,0 >15 64,0 Total 37749 Total 9018 Total 62696 Total 34,1 8,1 dIAGNOSTICO Mejora=0,013 Nodo 8 Categoría % <15 16,2 >15 83,8 Total 6,6 n 15075 15418 30493 BRONQUITIS; VERTIGO Y MAREOS; COLICO RENAL; CEFALEA; BRONQUITIS NO AGUDA NO CRONICA Nodo 9 Categoría % <15 81,2 >15 18,8 Total 9,1 n 1174 6082 7256 Nodo 14 Categoría % <15 35,7 >15 64,3 Total 10,3 codiag dico Mejora=0,002 Si Nodo 15 Categoría % <15 81,8 >15 18,2 Total 9,1 n 4076 7333 11409 LIUMBOCIATICA; ANSIEDAD; CERVICALGIA; DEPRESION Nodo 22 Categoría % <15 3,5 >15 96,5 Total 0,3 Nodo 23 Categoría % <15 27,8 >15 72,2 Total 5,6 n 10 272 282 Nodo 24 Categoría % <15 45,1 >15 54,9 Total 4,7 LUMBALGIA; CERVICALGIA; ESGUINCE TOBILLO; DORSALGIA Nodo 26 Categoría % <15 63,7 >15 36,3 Total 10,9 n 3300 3436 6736 OCUPACION Mejora=0,001 Nodo 29 Categoría % <15 53,4 >15 46,6 Total 4,5 Nodo 30 Categoría % <15 36,0 >15 64,0 Total 1,5 cluster provincia Mejora=0,000 3,0; 4,0 Nodo 35 Categoría % <15 59,7 >15 40,3 Total 2,7 Nodo 36 Categoría % <15 44,0 >15 56,0 Total 1,8 Nodo 37 Categoría % <15 56,5 >15 43,5 Total 1,4 Nodo 38 Categoría % <15 79,2 >15 20,8 Total 3,6 n 892 688 1580 n 3151 827 3978 3,0; 4,0 LUMBALGIA; CERVICALGIA Nodo 44 Categoría % <15 49,5 >15 50,5 Total 0,8 Nodo 45 Categoría % <15 47,1 >15 52,9 Total 2,2 n 412 421 833 dIAGNOSTICO Mejora=0,000 CERVICALGIA Nodo 47 Categoría % <15 41,0 >15 59,0 Total 0,4 n 1399 1429 2828 Nodo 41 Categoría % <15 55,3 >15 44,7 Total 0,7 dIAGNOSTICO Mejora=0,000 1,0; 2,0 n 480 267 747 <= 43 - 51 1,0; 2,0 Nodo 40 Categoría % <15 49,5 >15 50,5 Total 2,6 n 2247 1433 3680 Nodo 48 Categoría % <15 59,1 >15 40,9 Total 0,4 ESGUINCE TOBILLO; DORSALGIA n 1154 1294 2448 Nodo 46 Categoría % <15 64,5 >15 35,5 Total 0,3 TRAMEDAD Mejora=0,000 ESGUINCE TOBILLO n 182 262 444 <= 38 - 42 n 230 159 389 Nodo 49 Categoría % <15 44,8 >15 55,2 Total 1,6 > 38 - 42 n 811 998 1809 n 601 611 1212 Nodo 34 Categoría % <15 59,8 >15 40,2 Total 1,2 TRAMEDAD Mejora=0,000 3,0; 4,0 Nodo 39 Categoría % <15 61,1 >15 38,9 Total 3,3 cluster provincia Mejora=0,000 Nodo 43 Categoría % <15 64,3 >15 35,7 Total 0,7 Nodo 33 Categoría % <15 49,6 >15 50,4 Total 1,1 n 3646 2862 6508 cluster provincia Mejora=0,000 LUMBALGIA; DORSALGIA CERVICALGIA; ESGUINCE TOBILLO n 893 1136 2029 NO SI Nodo 32 Categoría % <15 56,0 >15 44,0 Total 5,9 n 4043 1515 5558 dIAGNOSTICO Mejora=0,001 1,0; 2,0 n 1794 1210 3004 M Nodo 31 Categoría % <15 72,7 >15 27,3 Total 5,0 M Nodo 28 Categoría % <15 36,0 >15 64,0 Total 2,4 n 1385 1138 2523 HIJOSDICO Mejora=0,000 H n 613 1090 1703 n 2350 2857 5207 H Nodo 27 Categoría % <15 54,9 >15 45,1 Total 2,3 n 7689 4377 12066 SEX Mejora=0,001 DIRECCION EMPRESAS; OPERADORES Y MONTADORES; TRABAJADORES NO CUALIFICADOS; EMPLEADOS ADMINIISTRATIVOS; TECNICOS Y PROFESIONALES DE APOYO; CIENTIFICOS E INTELECTUALES; SERVICIOS RESTAURACION Y PROTECCION; FUERZAS ARMADAS n 2687 2346 5033 5 74 79 SEX Mejora=0,001 LIUMBOCIATICA; ANSIEDAD; DEPRESION MANUFACTURA, CONSTRUCCION Y MINERIA; 99; AGRICULTURA Y PESCA No n LUMBALGIA; ESGUINCE TOBILLO; DORSALGIA n 1726 4476 6202 dIAGNOSTICO Mejora=0,002 Nodo 25 Categoría % <15 49,0 >15 51,0 Total 6,1 Nodo 16 Categoría % <15 6,3 >15 93,7 Total 0,1 n 8201 1822 10023 Nodo 50 Categoría % <15 53,7 >15 46,3 Total 0,6 n 343 296 639 n 245 135 380 > 43 - 51 n 403 326 729 Nodo 42 Categoría % <15 41,0 >15 59,0 Total 0,4 n 198 285 483 n 450 800 1250 BRONQUITIS; VERTIGO Y MAREOS; COLICO RENAL; DIARREA; CEFALEA; BRONQUITIS NO AGUDA NO CRONICA; MIGRAÑA Nodo 11 Categoría % <15 15,4 >15 84,6 Total 0,7 n 51214 1380 52594 GASTROENTERITIS; FARINGITIS AGUDA; RESFRIADO COMUN; GRIPE; GASTOENTERITIS NO INFECCIOSAS; ANGINA STRP; GRIPE OTRAS MANIFEST RESP; AMIGDALITIS AGUDA Nodo 12 Categoría % <15 64,3 >15 35,7 Total 0,5 n 111 612 723 codiag dico Mejora=0,001 dIAGNOSTICO Mejora=0,002 Si No n 10989 7813 18802 Nodo 10 Categoría % <15 97,4 >15 2,6 Total 47,5 n 8206 1896 10102 No CASADO/A; SOLTERO/A; DIVORCIADO/A; PAREJA HECHO; VIUDO/A n 10999 8085 19084 1,1 dIAGNOSTICO Mejora=0,001 GASTROENTERITIS; FARINGITIS AGUDA; RESFRIADO COMUN; GRIPE; GASTOENTERITIS NO INFECCIOSAS; ANGINA STRP; GRIPE OTRAS MANIFEST RESP; DIARREA; MIGRAÑA; AMIGDALITIS AGUDA codiag dico Mejora=0,001 DESCONOCIDO Nodo 21 Categoría % <15 58,4 >15 41,6 Total 17,0 56,6 dIAGNOSTICO Mejora=0,004 AMENAZA DE ABORTO; HERNIA INGUINAL; ESGUINCE CERVICAL; TUNEL CARPIANO; OTRAS COMPLIC. ESP EMBARAZO; REACCIÓN ADAPTACIÓN; MENISCOPATIA INTERNA ECIVIL Mejora=0,007 Nodo 13 Categoría % <15 57,6 >15 42,4 Total 17,2 DIRECTO Nodo 3 Categoría % <15 43,0 >15 57,0 LUMBALGIA; LIUMBOCIATICA; ANSIEDAD; CERVICALGIA; ESGUINCE TOBILLO; DEPRESION; DORSALGIA Nodo 7 Categoría % <15 49,4 >15 50,6 Total 27,5 n 59870 4076 63946 PAGO Mejora=0,007 n 784 527 1311 n 965 1719 2684 Nodo 17 Categoría % <15 97,4 >15 2,6 Total 47,5 Si n 51207 1344 52551 n 339 188 527 CUENTA Mejora=0,000 Nodo 18 Categoría % <15 16,3 >15 83,7 Total 0,0 AJENA n 7 36 43 Nodo 19 Categoría % <15 35,9 >15 64,1 Total 0,1 PROPIA n 42 75 117 Nodo 20 Categoría % <15 72,4 >15 27,6 Total 0,4 n 297 113 410