Lecturas recomendadas: desde la academia a la divulgación científica
Como podéis imaginar, eso son muchos libros y referencias, por lo que hemos votado aquellas más relevantes para nosotros. Este año hemos vuelto a descubrir en los libros a un magnífico compañero, justo cuando hemos tenido que limitar y repensar el propio concepto de la compañía con motivo de la pandemia.
En este artículo reflejamos los libros más recomendados. Hay libros sobre estadística, matemáticas, Machine Learning (aprendizaje automático), Deep Learning (aprendizaje profundo) o visualización, pero también lecturas que ponen el foco en los dilemas que plantea la Inteligencia Artificial y otros sobre gestión de equipos y negocio. Al final, hemos optado por hacer dos clusters entre todos los títulos que se presentan a continuación: por un lado, libros con un carácter más académico o técnico; por otro lado, lecturas divulgativas que nos permiten entender mejor algunos aspectos de este apasionante mundo de los datos y la Inteligencia Artificial.
Libros académicos
Deep Learning (Adaptative Computation and Machine Learning Series). Ian Goodfellow, Yoshua Bengio, Aaron Courville
Texto de referencia que reconstruye desde principios básicos el dominio de Deep Learning de manera exhaustiva. Está dividido en 3 partes: “Applied Maths and Machine Learning Basics”, que hace un repaso de las matemáticas y conceptos necesarios para abordar el tema; “Deep Networks: Modern Practices”, donde se presentan las ideas y aplicaciones de Deep Learning, y “Deep Learning Research” donde se repasa una variedad de ideas y conceptos más avanzados. Aunque es un libro teórico, su lectura es relativamente asequible, incluso amena en las dos primeras partes. Brilla como material de consulta o para afianzar conceptos aprendidos en textos más prácticos como “Deep Learning with Python” de F. Chollet.
Pattern Recognition and Machine Learning. Christopher Bishop
Texto académico que introduce las áreas básicas del Machine Learning, desde probabilidad y modelos lineales hasta modelos gráficos, redes neuronales o modelos latentes. Destaca su originalidad en el orden de explicar las cosas: el libro empieza explicando un tema muy básico (modelos lineales), pero aprovecha para ilustrar ahí todos los conceptos que son clave (overfitting, inferencia bayesiana, regularización, selección de modelos). Esto ayuda a que el lector capte desde muy al principio la “esencia” de Machine Learning y luego facilita el entendimiento de las áreas más complicadas.
Por mencionar también algún contrapunto, el libro es algo antiguo y no cubre ciertos nuevos avances consolidados (Deep Learning o causalidad); pero en todo caso sigue vigente — al fin y al cabo, las bases no han cambiado tanto. También fue escrito en una época en que no había tantos recursos prácticos, con lo que el libro se queda en el plano de las explicaciones matemáticas y ejemplos gráficos (ambos, por otro lado, excelentes).
The Elements of Statistical Learning. Trevor Hastie, Robert Tibshirani and JH Friedman.
Este es uno de los libros considerados de referencia sobre Machine Learning y que se ha vuelto clásico con el tiempo. Fue publicado por primera vez en 2001, antes de que la ciencia de datos y el aprendizaje automático se popularizaran. Escrito por Trevor Hastie, Robert Tibshirani, y Jerome Friedman, tres estadísticos de la Universidad de Stanford, el libro es un viaje exquisito por el mundo del aprendizaje automático con un enfoque matemático y estadístico, sin abusar de la teoría y siempre acompañado de ejemplos didácticos escritos con soltura, así como gráficos muy útiles y elegantes. El libro cubre tópicos que suenan familiares hoy en día pero que son imprescindibles conocer para los practicantes del modelado predictivo, tales como: métodos de regresión y de clasificación, técnicas de regularización, métodos basados en Kernels, métodos basados en ensambles, evaluación y selección de modelos o técnicas de reducción de dimensiones, entre otros.
Networks. An Introduction. M.E.J. Newman.
La mejor referencia para introducirse y llegar incluso a profundizar bastante en el mundo de las redes complejas o analítica de grafos. Es un libro denso que parte de las definiciones más básicas a nivel teórico/matemático de los fundamentos de las redes. Muy detallado en métricas y estructuras de redes, algoritmos de similitud, búsqueda de caminos o algoritmos de propagación, entre otros. No es demasiado práctico – no tiene código – pero el lenguaje y los ejemplos son muy comprensibles si se dispone de conocimientos básicos de álgebra lineal y matricial. Uno de sus apartados trata, además, el coste computacional que tendrían estos algoritmos implementados en la práctica.
Además, es muy útil para entender cómo modelar problemas con este tipo de técnicas para redes sociales, las redes de computadores o las epidemias. Sobre esto último, muy de actualidad por desgracia debido al COVID-19, existe un capítulo entero “epidemics on networks” dedicado a algoritmos para modelar el contagio (SIR, SIS, SIRS, etc. ). Esto se encuadra en la última parte del libro, dentro de todo lo que son procesos en redes, evolución temporal de señales y sus dinámicas. Considero que es algo difícil de encontrar en la literatura y aquí se aborda muy bien.
Machine Learning. A Probabilistic Perspective. Kevin P. Murphy.
Un buen libro de referencia para profundizar en todos los aspectos relacionados con el aprendizaje automático que se ha convertido en un clásico desde su primera edición en 2012.
El autor realiza un excelente trabajo a la hora de presentar los diferentes campos que han contribuido al avance del área desde los enfoques más estadísticos (regresión lineal, logística, selección de modelos, modelos gráficos) hasta los más computacionales (árboles de decisión, kernels, redes neuronales) buscando un nexo probabilístico bayesiano pero que no deja de ser a la vez pragmático. Además, gran parte de las técnicas se enlazan con aplicaciones al campo de la visión, procesamiento de lenguaje natural o las redes.
En los próximos meses, la segunda edición se renueva y amplía para cubrir tanto los fundamentos como los últimos avances especialmente en el campo del aprendizaje con redes profundas. Lo que es aún mejor, el código de ejemplos y figuras estará disponible en Python lo que complementa la rigurosa presentación matemática del libro.
Scientific dissemination
Weapons of Math Destruction. Cathy O’Neil.
En este libro Cathy O’Neil presenta y subraya, usando sus palabras, “big data increases inequality and threatens democracy”, es decir, cómo el big data aumenta la desigualdad y amenaza la democracia. A pesar de esta frase, quizá un poco sensacionalista, la autora nos cuenta a través de varios ejemplos reales y experiencias personales cómo muchas decisiones que nos afectan en el día a día no están tomadas por humanos sino por algoritmos (Armas de Destrucción Matemática, como ella los llama). Y, aunque tengan una base matemática, no implica que sean justos y neutrales, sino que pueden incluir sesgos – por ejemplo debido a los datos de entrada que usan o a la formación cultural de quien los programa -, y no tener en cuenta las preocupaciones éticas y morales.
Aunque es un libro entretenido y bien escrito (muy acertado el uso de la preparación de la comida para explicar qué es un modelo) lo recomendaría a un público que ya tiene un conocimiento previo sobre Inteligencia Artificial.
A pesar de ser en general un libro crítico sobre los algoritmos, en la última parte aporta una propuesta de solución al problema – no os voy a hacer spoiler, lo vais a poder descubrir leyéndolo ;).
How Charts Lie, Alberto Cairo.
Las redes sociales han hecho que los gráficos, las infografías y los diagramas sean omnipresentes y más fáciles de compartir que nunca. Si bien estas visualizaciones pueden informarnos mejor, también pueden engañar al mostrar datos incompletos o inexactos, lo que sugiere patrones engañosos, o desinformar al estar mal diseñados.
Muchos de nosotros estamos mal equipados para interpretar las imágenes que los políticos, periodistas, anunciantes e incluso empleadores presentan cada día, lo que permite a los malos actores manipular fácilmente las imágenes para promover sus propias agendas. Las conversaciones públicas están cada vez más impulsadas por números y, para darles sentido, debemos ser capaces de decodificar y utilizar la información visual. Al examinar ejemplos contemporáneos que van desde infografías de resultados electorales hasta mapas del PIB global y gráficos de registros de taquilla, How Charts Lie nos enseña cómo hacer precisamente eso.
The Book Of Why: The New Science of Cause and Effect. Pearl, J. and Mackenzie, D.
Este libro establece una conexión entre lo que entendemos por Data Science y lo que realmente es el descubrimiento científico (correlación frente a causalidad). Para ello se apoya en diferentes metáforas, como “la escalera de causalidad”, que creo que son bastante intuitivas para el lector menos experto en el tema.
El libro recorre la historia de la lucha entre correlación y causalidad desde varios puntos de vista (filosófico, moral y matemático). Para ello, utiliza varios ejemplos como la lucha dentro de la comunidad científica por establecer el tabaco como causa de cáncer.
Hacia el final del libro se establece un marco matemático que se apoyaría sobre el “big data” y la estadística tradicional con el que poder trabajar más formalmente las cuestiones de causalidad. El libro está escrito por el ganador del premio Turing e inventor de las redes Bayesianas, Judea Pearl.
Creativity, Inc., by Ed Catmull
Escrito por Ed Catmull (fundador de Pixar y uno de los padres de los gráficos por computador), narra diversas épocas de su vida. Desde su etapa académica en la universidad de Utah hasta la historia reciente de Pixar, pasando por una transición desde la investigación académica a la privada.
Este libro contiene lecciones sobre manejo de equipos y generación de culturas que fomentan la creatividad. Todas basadas en su experiencia de gestión en entornos con una gran necesidad de experimentar, poner en común nuevas ideas y manejar la incertidumbre.