Inteligencia y embodimentun enfoque basado en técnicas de mecánica estadística
- Chinea Manrique de Lara, Alejandro
- Elka Adoslavova Koroutcheva Directora
Universitat de defensa: UNED. Universidad Nacional de Educación a Distancia
Fecha de defensa: 13 de de juny de 2013
- Rosa María Benito Zafrilla President/a
- José Javier García Sanz Secretari/ària
- Pablo Varona Vocal
- Javier Galeano Prieto Vocal
- Víctor Fairén Le Lay Vocal
Tipus: Tesi
Resum
La palabra inteligencia procede del latín ¿Intelligentiam¿ la cual describe cualquier habilidad, destreza, o facultad de entender con objeto de elegir las mejores opciones para resolver una situación. La inteligencia es la aptitud para crear relaciones, aprender y proyectar de los mamíferos superiores y especialmente del hombre (Sternberg & Kaufman, 2011). Por ejemplo, el campo de la Inteligencia Artificial arguye que para que un sistema pueda calificarse de inteligente, éste debe poseer habilidades cognitivas tales como razonar, planear, resolver problemas, capacidad de abstracción, comprender ideas, lenguajes y aprender. En este sentido, el concepto de inteligencia ha generado toda una serie de polémicas, y hasta muy recientemente las definiciones de ésta se centraban fundamentalmente en conceptos antropomórficos, esto es, se entendía la inteligencia como un concepto intrínseco al ser humano pero ajeno al resto de las especies. No obstante, en términos generales, el concepto de inteligencia siempre puede interpretarse como un proceso emergente resultado de la interacción de componentes más simples (por ejemplo de las neuronas). Dentro de este contexto se desarrolla la presente tesis doctoral, cuyo tema principal, como su título indica, versa sobre el análisis y estudio de las bases biológicas de la inteligencia entendida ésta como un proceso emergente. Este enfoque particular conlleva al planteamiento de modelos basados en técnicas de mecánica estadística (Chandler, 1989; Reichl, 1998). Concretamente, esta rama de la física tiene por objeto el tratar de explicar el comportamiento de sistemas compuestos por un gran número de partículas (se habla de sistemas macroscópicos) a partir de las características de sus elementos constituyentes microscópicos (las partículas). En este sentido el modelo planteado en la presente tesis doctoral, presenta, amén de tratarse de un modelo matemático, una serie de novedades y mejoras sobre los modelos y teorías de inteligencia actuales. Tales mejoras descansan fundamentalmente sobre las hipótesis que se formulan a continuación: ¿ La perfecta comprensión de la inteligencia biológica, esto es, de las formas de inteligencia que pueden apreciarse en la naturaleza, entendemos, no puede realizarse sin un estudio detallado y comprensión de los aspectos evolutivos asociados al substrato biológico de la misma, esto es al cerebro. ¿ El uso de un conjunto de técnicas recientes y avances en el campo de la matemática discreta las cuales aportan un nuevo enfoque a problemas matemáticos hasta ahora imposibles o muy difíciles de resolver mediante el uso de técnicas tradicionales de mecánica estadística. 2. Motivación y Objetivos Uno de los conceptos que tradicionalmente ha provocado mayor controversia y debate es sin lugar a dudas el concepto de inteligencia (Stanovich, 2009; Jensen, 1998; Eysenck, 1988; Flynn, 2007). Cabe destacar, entre otros, que una de las principales razones ha sido la variedad de definiciones que se han formulado al respecto (Sternberg & Kaufman, 2011) así como la discrepancia entre las mismas. Dicha complejidad ha hecho que los esfuerzos en investigación se hayan dirigido mayormente a la emulación de ciertos aspectos de la inteligencia más que en investigar propiamente los mecanismos que operan y permiten la aparición de la misma. Actualmente las teorías y modelos que existen al respecto provienen principalmente del campo de la psicología (Jung & Haier, 2007; Newman & Just, 2005; Garlick, 2002; Garlick, 2003), esto es, no existe actualmente, salvo opinión contraria, ningún modelo matemático que plasme o explique de manera clara el citado concepto o cuando menos sus principios. No obstante, es importante resaltar la existencia toda una gran variedad de modelos que si bien no representan o dan cuenta de forma explícita del concepto de inteligencia lo hacen de alguna de sus características. Por ejemplo, en el campo de la neurociencia existen una infinidad de modelos (Hecht-Nielsen & Mackenna, 2003) que tratan de explicar algunos aspectos de las funciones cognitivas. En el campo de la mecánica estadística se estudiaron las propiedades de toda una serie de modelos (Mezard et al., 2004; Engel & Van den Broeck, 2001) de redes neuronales artificiales. De forma similar, en el área de investigación del aprendizaje de máquinas (Haykin, 1999; Bishop, 1997, 2006) se propusieron una gran variedad de modelos (por ejemplo, de redes neuronales artificiales) que contaban, aunque de forma muy simplificada, con las características comunes a los sistemas biológicos inteligentes como son la capacidad de aprendizaje y generalización. En resumen, el objetivo principal de esta tesis doctoral es el planteamiento de un modelo matemático basado en técnicas de Mecánica Estadística que explique las bases teóricas necesarias para la emergencia de la inteligencia (biológica). Para ello se formula una hipótesis fundamentada en la síntesis de observaciones empíricas y teorías procedentes del campo de la Neurociencia Evolutiva, Psicología Cognitiva y Antropología Evolutiva. Dicha hipótesis, la cual bautizamos como la hipótesis de inteligencia animal con base en el embodiment, se valida, a partir del modelo propuesto, en base a predicciones realizadas a partir de observaciones experimentales y la cual permitirá proporcionar respuestas plausibles a las preguntas que se formulan a continuación: ¿ ¿Existe una estructura de base a partir de la cual emerge la inteligencia o para la emergencia de comportamientos que podamos calificar de inteligentes? ¿ En caso afirmativo, ¿Se trata de una estructura única? ¿ ¿Es posible explicar la similitud y disparidad en los niveles de inteligencia observables en las diferentes especies de animales? Paralelamente, como colofón a lo anterior, se aplican las técnicas modernas de matemática discreta utilizadas para la formulación del modelo de mecánica estadística en la reducción de la complejidad computacional de modelos específicos del campo de investigación relativos al aprendizaje de máquinas, esto es, se trata de modelos dinámicos con capacidad de aprendizaje y generalización que más se aproximan al concepto de inteligencia. 3. Organización y Desarrollo Teórico La presente tesis doctoral ha sido estructurada de la siguiente forma: Tras una fase de estudio relativo tanto a teorías recientes de neurociencia evolutiva (Hecht-Nielsen, 2007; Canfield et al., 2007; Fike et al., 2006; Kerr, 2006) y antropología evolutiva (Tomasello, 2008) como a recientes teorías del campo de la psicología cognitiva centradas en torno al concepto de ¿Embodiment¿ , el cual, a grandes rasgos, viene a expresar la profunda influencia que posee el sistema motor en la cognición humana (Zwaan, 2004; Gallese and Lakoff, 2005; Glenberg and Kaschak, 2003; Vigliocco et al., 2004; Tyler and Moss, 2001; Simmons and Barsalou, 2003; Pulvermüller, 1999; Mahon and Caramazza, 2008; Patterson et al., 2007; Rogers et al., 2004). El objetivo principal de este capítulo consiste en presentar una síntesis de los procesos evolutivos que han dado lugar a la cognición, así como las ideas más importantes correspondientes a las recientes teorías de embodiment del campo de la psicología cognitiva en aras de presentar las pistas e información clave para la comprensión del desarrollo evolutivo de la inteligencia. Seguidamente en el capítulo 2 se propone, en base a las teorías y evidencias empíricas presentadas, una formulación basada en mecánica estadística que aporta luz a los mecanismos de base que fundamentan la emergencia de la inteligencia biológica. Concretamente, se calculan los potenciales termodinámicos asociados a la formulación propuesta. En cuanto a la metodología se refiere se hace uso de un conjunto de técnicas recientes y avances en el campo de la matemática discreta (Flajolet and Sedgewick, 2009). El capítulo 3 se dedica por entero a la interpretación física del modelo. Concretamente, se utiliza la entropía como una medida aproximada del concepto de inteligencia mientras que la energía libre se utiliza para explicar las propiedades computacionales que emergen a nivel macroscópico como consecuencia de la hipótesis formulada. Paralelamente, con objeto de justificar la relevancia de los resultados teóricos obtenidos se presentan un ejemplo de aplicación del modelo consistente en explicar las capacidades cognitivas de dos especies sofisticadas desde un punto de vista cognitivo como son delfines y elefantes. De forma similar se contrastan los resultados teóricos obtenidos con las teorías de inteligencia y antropología evolutiva actuales y se proporciona una respuesta a las preguntas formuladas en los objetivos de partida de la investigación. Por otra parte, en el capítulo 4 se presentan los modelos recursivos (Frasconi et al., 1998, Baldi & Rosen-Zvi, 2005; Scarselli et al., 2005; Micheli et al., 2004; Bianchini et al., 2006) como herramientas potentes de modelado las cuales pueden ayudar en la implementación computacional de la hipótesis formulada. Concretamente, a partir de datos empíricos tales como los generados a partir de los registros de actividad cerebral. En este sentido, dadas las ingentes cantidades de datos que dichas técnicas generan, se aplican las técnicas de matemática discreta utilizadas en el desarrollo del modelo en la reducción de la complejidad computacional de la regla de aprendizaje estocástica vario-eta, la cual resulta apropiada en problemas de aprendizaje a gran escala. Por último en el capítulo 5 se presentan las conclusiones globales de la tesis doctoral así como un bosquejo de las perspectivas de investigación futuras. 4. Conclusiones: En esta tesis doctoral se investiga principalmente una hipótesis relativa a la existencia de un principio de procesamiento de la información común asociado a todos los sistemas nerviosos resultado del proceso evolutivo como base para la emergencia de la inteligencia. Dicha hipótesis se denota como la hipótesis de inteligencia animal con base en el embodiment. Concretamente, se presenta un modelo que combina avances recientes en psicología cognitiva (teorías de embodiment) y neurociencia evolutiva que trata de explicar la inteligencia como un fenómeno emergente resultado de un conjunto de interacciones basadas en representaciones de conocimiento (símbolos) implementadas desde un punto de vista físico como estados de redes atractoras. Dichas interacciones simbólicas son denotadas como primitivas de movimiento con objeto de enfatizar que éstas tienen su fundamento en el principio de conservación filogenética, esto es, se trata de un mecanismo conservado a través del proceso evolutivo, modelándose éstas en términos de estructuras similares a árboles de Cayley. Los efectos macroscópicos asociados a las estructuras que plantea el modelo se analizan haciendo uso de técnicas de mecánica estadística. Como resultado de dicho análisis se proporcionan explicaciones plausibles relativas a las disparidades y similitudes existentes en los niveles de inteligencia observados en las diferentes especies. De forma similar también se proporciona una interpretación sobre la eficiencia de las operaciones realizadas por los sistemas nerviosos fruto del proceso evolutivo. Finalmente, los resultados teóricos obtenidos y sus implicaciones frente a teorías modernas de inteligencia y teorías de antropología evolutiva se discuten demostrándose la consistencia de la hipótesis formulada. Bibliografía Extracto parcial de la bibliografía utilizada: Arbib, M. (1968). (Editor). Algebraic Theory of Machines, Languages and Semigroups. New York: Academic Press. Baldi, P., Rosen-Zvi, M.: On the Relationship between Deterministic and Probabilistic Directed Graphical Models: from Bayesian Networks to Recursive Neural Networks. Neural Networks 18 (8), 1080-1086 (2005). Bianchini, M., Gori, M, Sarti, L., Scarselli, F. (2006). Recursive Processing of Cyclic Graphs. IEEE Transactions on Neural Networks 9 (17), pp. 10-18. Bishop, C.M. (1997). Neural Networks for Pattern Recognition. Oxford, Oxford University Press. Bishop, C.M. (2006). Pattern Recognition and Machine Learning. Springer Science+Business meadia, LLC. Canfield, D.E., Poulton, S.W. & Narbonne, G.M. (2007). Late-Neoproterozoic deep-ocean oxygenation and the rise of animal life. Science, 315, 92-95. Chandler D., (1987). Introduction to Modern Statistical Mechanics. Oxford University Press Decety, J., & Grèzes, J. (2006). The power of simulation: Imagining one's own and other's behavior. Brain Research, 1079, 4-14. Engel, A., & Van den Broeck, C. (2001). Statistical Mechanics of Learning. Cambridge, UK: Cambridge University Press. Eysenck, H.J., (1988). The concept of "intelligence":Useful or useless? Intelligence, 12, 1-16. Fike D. A., Grotzinger J. P., Pratt L. M., & Summons R. E. (2006). Oxidation of the Ediacaran ocean, Nature, 444:744-747. Flajolet, P., & Sedgewick R. (2009). Analytic Combinatorics. Cambridge, UK: Cambridge University Press. Flynn, J.R. (2007). What is intelligence? Beyond the Flynn effect. New York. NY, Cambridge University Press. Frasconi, P., Gori, M, Sperduti, A.: A General Framework for Adaptive Processing of Data Structures. IEEE Transactions on Neural Networks 9 (5), pp. 768-786 (1998). Gallese, V., & Lakoff, G. (2005). The brain's concepts: The role of the sensory-motor system in conceptual knowledge. Cognitive Neuropsychology, 22(3/4), 455-479.