Llamo a un servicio de atención al cliente y una grabación me recibe cordialmente recordándome lo importantísima que es para la compañía mi satisfacción, y prometiéndome que va a intentar solucionar mi problema, aunque para ello tengo que contestar a una serie de preguntas. Mi problema es muy concreto, pero poco habitual. Con un poco de suerte se resolverá con un sí o un no, me bastaría con que una persona informada y conocedora del servicio me diese 20 segundos de su tiempo. Pero todos sabemos que ya estamos en 2020, y eso lo que quiere decir es que la forma que esta compañía ha considerado más eficaz y vanguardista de atenderme es la de despedir al 99% de su personal dedicado a estos menesteres y someterme a un invento del siglo XVIII llamado clave dicotómica. Con una calma parsimoniosa, la voz me someterá a preguntas basadas en las llamadas más comunes de los usuarios, y en función de mi respuesta, me irá derivando a otras preguntas hasta conseguir clasificar mi problema en categorías preestablecidas. Y yo sufro. Sufro porque sé demasiado sobre claves dicotómicas. Sé que son intrínsecamente ineficientes, producto de las limitaciones de su época. Sé que si mi duda es poco habitual, tendré que esperar hasta el final, hasta llegar a ese cajón de sastre de especies poco conocidas y mal resueltas. Sé que ante preguntas ambiguas puedo perderme en una sección que no me corresponde. Tras casi diez minutos de “yes” “no” y de pedir un “representative” sin éxito, llego por fin a a mi destino, recibo (como temía) una respuesta insatisfactoria y me cuelgan de forma automática. Quien haya intentado identificar mediante claves dicotómicas plantas, escarabajos o cualquier organismo de afinidad incierta, estará de acuerdo en que esa sensación es parecida a la de llegar a un punto muerto en una clade de 30 niveles.
Hoy en día, si alguien cuelga una foto de una planta en una red social y el autor pide ayuda para averiguar de qué se trata, invariablemente, hay una o varias personas que sugieren hacer una búsqueda inversa en Google Imágenes o usar tal o cual app. En otras palabras: en 2020, la reacción inmediata del cuidadano medio (de buena parte del mundo) ante un desafío intelectual como este es esperar que Google le saque las castañas del fuego. Mi interpretación de este gesto ha evolucionado en los últimos 6-7 años. Al principio, aunque no entendía por qué, esa respuesta espontánea de tantos usuarios de twitter y facebook (“míralo en Google”; “usa esta app que es como el Shazam pero con plantas”)… en el fondo ¡me molestaba! Tenía todo el sentido que alguien hiciese esa sugerencia, pero en el fondo me irritaba leerla ¡Y haciendo introspección no era capaz de entender por qué! Hoy, además de no tener ya esa reacción, y de ser un ferviente defensor de las aplicaciones de identificación de bichos y yerbajos, soy capaz de sacarle mucho jugo al papel que tienen y tendrán.
Como digo, he tardado un tiempo en entender de verdad los motivos de mi irritación inicial, pero ahora creo que los puedo explicar. Identificar plantas no es fácil. Se requiere una atención al detalle, un conocimiento previo de la flora de un lugar y un manejo de un vocabulario muy extenso y muy preciso. Es una competencia que se tarda años en adquirir, que se oxida con facilidad si se descuida y que muy poca gente llega a dominar. Aclaro que para nada estoy hablando de mí: habiendo tenido como maestros a botánicos que, ellos sí, son auténticos expertos, con un conocimiento enciclopédico de la flora, me acompleja saber que nunca en mi vida llegaré a tener ni la mitad de su soltura en el campo. Mi amor propio y mi interés me obliga a intentar mantenerme mínimamente competente, pero soy muy consciente de mis limitaciones.
Saber identificar animales y plantas en el campo es precisamente una de las habilidades por las que me enamoré de la biología. En un viaje de fin de curso (tendría 13 años o así) a la sierra de Cazorla, uno de los monitores iba revelándonos los nombres de plantas, mariposas y aves que se cruzaban en nuestro camino. Como una enciclopedia andante, señalaba, decía el nombre común, acto seguido el científico y añadía algún detalle o curiosidad sobre su biología, y así se tiraba hablando horas. Esa capacidad me deslumbró. Aquel acceso a un plano superior del conocimiento natural se convirtió en objeto de deseo: yo quería iniciarme en esa secta y ser capaz de reconocer a las flores más humildes y a los gusanos más huidizos. A mí ya me interesaba la naturaleza en ese momento, pero aquel chico fue mi primera exposición real a lo que, inmediatamente, entendí que era un biólogo. Esa palabra se dignificó a partir de ese momento: un biólogo era alguien capaz de señalar y llamar por su verdadero nombre a las plantas sin aminorar el paso.
Como curiosidad: este recuerdo estaba, en realidad, muy exagerado por lo impresionable que era yo a esos años. Aquel monitor en cuestión (que a mí me parecía el hombre más sabio del mundo y el pobrecillo debía ser el típico biólogo buscándose la vida en condiciones precarias) tuvo que consultar en la guía de campo la identidad de la zarzaparrilla. En su momento imaginé que debía tratarse de una planta dificilísima de encontrar como para tener que recurrir al libro. Hoy esa idea me hace sonreir: muy sabio, muy sabio seguramente no era, pero lo importante es que supo transmitir esa pasión a un impresionable copepodín.
Pero a lo que voy: si le pides a un botánico que intente identificar una planta con una foto tomada con el móvil, éste inicia un proceso que no funciona como una receta planificada, sino que es más bien una labor detectivesca que no se sabe por dónde te va a llevar. Puede pasar que nada más ver la foto ya sepa exactamente, o casi, de qué se trata. Quizá porque la foto esté muy detalla, o quizá porque ya con la primera impresión, incluso aunque la foto sea pobre, su cerebro reconozca de forma casi intuitiva ciertos rasgos. Esa sensación de reconocimiento inmediato os resultará muy familiar. Sobre los procesos heurísticos que se desarrollan en el cerebro cuando alguien reconoce un ser vivo ya hablé en el post del giss (general impression of shape and size), para entendernos, la intuición fruto de experiencias anteriores. Como dije en su momento, aunque esto pueda parecer poco científico, esas intuiciones de la gente experimentada, tienen su fundamento real. Incluso cuando no sabes qué planta es, este giss suele poner sobre la pista a partir de uno o dos rasgos aislados que para la persona no iniciada no tienen valor alguno. A veces otros detalles (la zona geográfica, el tipo de hábitat,…) ayudan a descartar posibles opciones. Por supuesto esto se puede hacer con ayuda de la documentación necesaria (sí, claves dicotómicas, pero por favor, no os quedéis en el Bonnier, que veo que tristemente sigue siendo mencionado en Twitter), pero a lo que voy es que la persona experimentada es capaz de encontrar atajos en esas claves dicotómicas, descartar casi de forma inmediata fotos que para otros individuos resultarían confusas, etc. La experiencia puede permitirte saltarte toda esa ristra de preguntas del servicio de atención al cliente y darte directamente la solución. Identificar organismos se parece mucho más a resolver una integral que una ecuación. A menudo no hay itinerario establecido, y es la experiencia previa (adquirida tras años de trabajo) la que puede traducirse en resolver el problema de forma eficaz. Al igual que resolver la integral, se trata de un proceso hasta cierto punto creativo e improvisado, un verdadero desafío cognitivo.
Mi frustración original con que alguien aspirase a que una app te identificase correctamente una especie no era que dicha información pudiera ser accesible a cualquiera, sino el hecho de que la app hiciese pensar que se trataba de un ejercicio trivial. Al principio esa actitud iba acompañada de desconfianza. Hace unos años hubiese dicho que aspirar a una identificación automática estaba muy lejos de ser posible, pero esto ha cambiado radicalmente en los últimos años. En este periodo me he hecho usuario acérrimo de iNaturalist (hablé un poco de ello aquí). Al principio lo usaba como un suplemento de mi cuaderno de campo donde registrar observaciones. Resultaba utilísimo para conocer nuevas especies porque la comunidad de usuarios es muy activa y amable, y en ella se encuentran tanto aficionados como profesionales con el conocimiento suficiente como para ayudarte a identificar casi cualquier cosa. Hasta aquí, nada nuevo. Sin embargo, en 2017, la app empezó a incluir una IA que te hacía sugerencias sobre posibles identificaciones. Al principio era bastante mala, pero con el tiempo, especialmente en zonas bien muestreadas y con buenos datos, se fue haciendo progresivamente mejor. Quedó registrado el momento en el que las mejoras de la IA me pillaron por sorpresa cuando un amigo me pidió ayuda para identificar un musgo y, tras darle mi opinión, me contó que la IA había dicho lo mismo.
Aquello me dejó muy sorprendido y tuve que mirarme bien a qué se debía mi desconfianza. Después de darle muchas vueltas entendí que lo que me irritaba de todo aquello es que la gente pensara que el proceso de identificar una planta era una trivialidad, algo fácil y no el complejo proceso cognitivo que os he mencionado antes. En el momento en el que pude verbalizar este dilema es cuando se deshizo por sí solo: es estupendo que la gente pueda resolver problemas complejos con facilidad. Ese es el fundamento de gran parte de nuestros avances intelectuales y tecnológicos: convertir problemas en trivialidades.
Más o menos por esta época, un miembro de una lista de correo de un grupo científico al que pertenezco, preguntó la opinión del respetable sobre dichas herramientas, y su pregunta fue recibida, bien con gélida indiferencia, bien con desprecio por parte de algunos grandes capitostes del gremio. Es inevitable preguntarse si dichas respuestas escondían cierto miedo a que se pierda una riqueza y un saber hacer que puede que las futuras generaciones no lleguen a experimentar. Alguno de ellos veía incluso en estas apps el fin de la botánica de campo. Yo no participé en aquel intercambio y hoy me arrepiento. Fue una oportunidad perdida a la que le llevo dando vueltas desde entonces, y este post no es más que una forma de resarcirme de ello.
Que no nos quepa ninguna duda: la automatización fidedigna en la identificación de organismos llegará antes de que nos demos cuenta y con un margen de error despreciable en la mayor parte de las ocasiones. Sin embargo, me parece absurdo tenerle miedo a ese momento. Decir que ese avance supondrá el fin de la biología de campo es lo mismo que decir que la capacidad de grabar sonidos supuso el fin de la música, y sin embargo no me cuesta imaginarme a un músico de la segunda mitad del siglo XIX, aterrado ante la idea de que su virtuosismo pudiese ser enlatado y reproducido. Es fácil olvidarse de que, hasta la invención del fonógrafo, si alguien quería disfrutar de la música necesitaba que hubiese en alguna medida músicos presentes. Presenciar la ejecución de un concierto, no digamos de una sinfonía, requería de la presencia de muchas personas, cada una de ellas con años de formación. Hoy en día, la música se ha convertido en un lujo en el que apenas reparamos, y es posible que el usuario premium de Spotify no valore en su justa medida todo lo que está detrás de poder disfrutar a su grupo favorito mientras se duerme en el autobús camino del trabajo, pero ¿Es el balance positivo o negativo? No creo que nadie ponga en duda la respuesta. La capacidad de grabar y reproducir sonido no solo no fue el fin de la música, sino todo lo contrario: marcó el inicio de su democratización, la chispa que desencadenaría una inacabable revolución artística que hoy continúa y el inicio de millones de vocaciones en todo el mundo.
La identificación automática de organismos no será el fin de nada, sino el comienzo de una nueva era de conocimiento e investigación. La opulencia de datos que ya está suponiendo abre un nuevo capítulo en el tipo e impacto de estudios que van a poder realizarse hasta extremos que hoy nos resultan difíciles de imaginar. Seguirá habiendo espacio y necesidad para el virtuosismo de los biólogos en el campo de la misma manera que quien quiera ser músico aún debe formarse y ejercitar sus destrezas personales con su instrumento. Un biólogo de campo profesional también deberá desarrollar como hasta la fecha esos atajos heurísticos de los que hablábamos antes, pero la capacidad de asociar un nombre a una flor desconocida estará, por fin, al alcance de todos, y quizá esa sea la puerta de entrada de muchas vocaciones.
Dos cuestiones, ya para ir cerrando: la identificación automática es útil también para los biólogos. Cada vez estoy más convencido de que las claves dicotómicas son un mal menor, un último recurso, y no la mejor forma de aprender pese a su aura de apoteosis de la ortodoxia. Con diferencia, la forma más eficaz de aprenderse especies desconocidas es ir repetidamente (la repetición es crucial en cualquier caso) al campo con alguien que se las sepa bien. Es así como se puede transmitir ese giss de forma eficiente y dirigida, corrigiendo errores, centrándose en los caracteres relevantes. Cuando no se tiene ese lujo, desde mi punto de vista el avance es mucho más lento, y pelearse con especies una a una usando solo claves dicotómicas no es un uso eficaz del tiempo. Cuando me ha tocado aterrizar en zonas de flora desconocida para mí y no he contado con la ayuda de alguien que me enseñe, he encontrado un aliado muy potente en un uso instrumental y crítico de las IAs de identificación automática. No se trata en ese caso de creerse el resultado ofrecido, sino usarlo como punto de partida a verificar usando la bibliografía disponible, tomando las notas habituales en el cuaderno de campo y revisándolas cuando toque. Sí que es cierto que hay que hacer un esfuerzo en la parte de verificación y a la hora de tomar notas y ejercitar ese círculo virtuoso de codificación-recuperación que es el que consolida la memoria a largo plazo. (Vamos, que lo que rápido se aprende, rápido se olvida, y por lo tanto hay que repasar contenidos de forma regular). Seguro que no he aprendido tanto como si hubiese tenido a un experto local en todas mis salidas de campo, pero también estoy convencido de que he aprendido mucho más que si hubiese tenido que sacar por clave y a pelo cada nuevo yerbajo.
Quizá hablo solo por mí, pero el mejor predictor de eficiencia usando una clave dicotómica es que la hayas usado mucho con anterioridad, que te hayas perdido en sus ambigüedades. Es decir, que se hace más eficiente cuanto menos falta te hace. Aplicar una clave nueva, de unos autores cuyo criterio no conoces, reinterpretar el uso de los adjetivos y de las excepciones es intrínsecamente ineficaz, y consecuencia de las limitaciones de su tiempo. Aunque identificar plantas con clave sea la quintaesencia del purismo, a día de hoy deberíamos aspirar, como mínimo, a crear claves de acceso múltiple, como la que desarrollaron en GoBotany con la flora de Nueva Inglaterra, para emplear desde el principio los caracteres relevantes. Estas claves, además, se aproximan mucho más a cómo funciona el cerebro del botánico experimentado cuando se enfrenta a un problema de identificación, permitiéndole abordar primero los caracteres relevantes que primero le llaman la atención. Son las equivalentes a poder saltar directamente a la pregunta que te atañe en el servicio de atención al usuario. Benditas sean.
Segunda cuestión final: ¿Cuáles son los “peros” a día de hoy de estas IA? He tenido ocasión de probar, además de la de iNaturalist, algunas otras apps de identificación de plantas (PlantNet, Leafsnap,…). En general son todas bastante mediocres por el momento, a menudo centradas en plantas ornamentales y que por tanto no resultan útiles en el campo. Lo que diferencia a la de iNaturalist de las otras apps no tiene solo que ver con características informáticas, sino con la existencia de una comunidad potentísima detrás, con más de un millón de usuarios que han realizado 52 millones de observaciones por todo el mundo, pertenecientes a 300.000 especies: una verdadera burrada. Somos los miembros de la comunidad los que estamos enseñando a la IA cómo identificar al haberse consolidado como la plataforma global más mayoritaria para el registro de la biodiversidad, y que cuenta entre sus miembros con una buena cantidad de expertos locales y taxónomos profesionales. En las zonas con alta densidad de usuarios y buena calidad de datos (sobre todo partes bien pobladas de EE.UU. y algunas de Europa) clava casi sistemáticamente las fotos relevantes de plantas vasculares o de vertebrados. El mundo de las aves va por libre, claro. El nivel de la comunidad de eBird y de aplicaciones relacionadas como Merlin BirdID merecerían un post aparte, pero si sois aficionados a la ornitología, seguro que ya las conocéis.
En grupos mucho menos conocidos resulta mucho más irregular, cometiendo a veces errores garrafales, que no son sino testimonio de que el algoritmo no está reconociendo las fotos por sus atributos morfológicos, sino por comparación con el banco de imágenes de la base de datos (y a veces te dice que un líquen es un pájaro solo porque el color es muy parecido). Además, no se me escapa que hay muchos errores de identificación, y que el uso acrítico de las identificaciones automáticas por gente sin criterio desemboca en que ciertos errores se perpetúan muchísimo. No se nos puede olvidar que la app no está identificando al individuo como lo haríamos nosotros, observando sus caracteres, sino haciendo una comparación con una base de datos que, para ser fiable, debe estar adecuadamente verificada… por la comunidad humana. A día de hoy, ninguna de las apps comerciales sería capaz, por ejemplo, de rebatir un criterio taxonómico concreto, de detectar especies no descritas aún, o de sinonimizar dos de ellas sin ayuda humana. Siendo como es una tecnología que está en pañales y que, de momento, lo único que sabe hacer es comparar muchas imágenes a la vez, no me cabe duda de que algún día sí que veremos cómo alcanza ese nivel de sofisticación cognitiva que hasta hace poco era el privilegio de algunos seres humanos.
En resumen: lo mismo soy yo el que se ha montado una empanada mental tremenda con todo este rollo, pero me parece detectar (y quizá he sido víctima de) cierta reticencia a la hora de adoptar y usar estas herramientas por una parte de la comunidad botánica y naturalista. Desde luego queda mucho por delante hasta que se pueda confiar “ciegamente” en estas apps. Puesto que no funcionan tomando las decisiones, sino comparando con una base de datos, hay que hacer de ellas un uso crítico y recurrir siempre que sea posible al criterio de un ser humano. Sin embargo, me parece inútil recelar de esta tecnología que cada vez será más poderosa tanto para el naturalista ocasional como para el profesional que necesite de herramientas adicionales. Trivializar problemas complejos no será el final de la biología de campo, simplemente nos abrirá las puertas a desafíos mucho más complejos. Y de la misma manera que la existencia de Spotify no le resta valor al virtuoso del piano ni placer a quienes disfrutan del concierto en directo, nada ni nadie podrá quitarnos la satisfacción de poder encontrarnos una planta en el campo y reconocerla por su verdadero nombre.