Cómo hacer cosas con palabras. Algunas reflexiones en torno a las inteligencias artificiales generativas de imágenes
Contenido principal del artículo
Resumen
Actualmente, la inteligencia artificial (IA) se ha convertido en un tema de relevancia y que afecta a diversas disciplinas. Una IA puede pensarse como la capacidad de las máquinas para realizar tareas que normalmente requieren de la inteligencia humana. Dentro de las posibilidades que ofrece el campo, una de las más notables es la IA generativa. Esta se focaliza en la generación de contenido, desde cierta perspectiva, original, como ser texto, imagen, voz, video, entre otras. Para ello, se requiere que el usuario le proporcione a la IA una indicación del producto que desea, mediante un texto escrito, conocido como prompt. Ahora bien, un fenómeno observado es la dificultad de que el resultado generado se corresponda totalmente con lo que el usuario desea, siendo necesario explicitar al máximo la indicación y de la manera menos ambigua posible, lo que en ocasiones se dificulta debido a la naturaleza misma del lenguaje. Aquí presentamos un pantallazo general de lo que son las IA generativas de imágenes y el fenómeno de la ambigüedad lingüística, que incide en la redacción de prompts para la generación de imágenes.
Descargas
Detalles del artículo
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Los autores de los artículos publicados conservan los derechos de copyright.
Licencia de uso:
Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.
Citas
Adelstein, Andreína, Marina Berri & Victoria Boschiroli (2012). Polisemia regular y representación lexicográfica: los nombres locativos en español. Terminalia, 5, 33-41.
Apresjan, Juri (1974). Regular Polysemy. Linguistics 12(142), 5-32.
Hidalgo, Danilo (1978). La ambigüedad lingüística. Filología y lingüística, 4(2), 39-45.
Pustejovsky, James (1995). The generative lexicon. Cambridge-Massachusetts: MIT Press.
Real Academia Española & Asociación de Academias de la Lengua Española (2009). Nueva gramática de la lengua española. Madrid: Espasa.
Alpaydin, Ethem (2026). Machine learning: The new AI. Cambridge-Massachusetts: MIT Press.
Ardilla, Rubén (2011). Inteligencia. ¿Qué sabemos y qué nos falta por investigar? Revista de la Academia Colombiana de Ciencias, 35(134), 97-103.
Chowdhury, Mashrur, Amy Apon & Kakan Dey (2017). Data Analytics for Intelligent Transportation Systems. Amsterdam: Elsevier.
López, Bruno (2007). Introducción a la inteligencia artificial. Recuperado de: http://www.itnuevolaredo.edu.mx/takeyas/Articulos/Inteligencia%20Artificial/ARTICULO%20Introduccion%20a%20la%20Inteligencia%20Artificial.pdf el 6/6/2023.
Mantegna, Micaela (2020). Inteligencia ARTEficial: creatividad computacional, inteligencia artificial generativa y derechos de autor. Tesis de maestría, Universidad de San Andrés.
Noy, Shakked & Whitney Zhang (2023). Experimental evidence on the productivity effects of the generative artificial intelligence. Recuperado de https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4375283 el 6/6/2023.
OpenAI. (2023). ChatGPT: Optimizing language models for dialogue. https://openai.com/blog/chatgpt/
Sternberg, Robert (2000). Handbook of intelligence. Nueva York: Cambridge University Press.
Piaget, Jean (1952). The origins of intelligence in children. Nueva York: International Universities Press.
McCormack, Jon, Camilo Cruz, Nina Rajcic, Stephen Krol, María Llano & Meng Yang (2023). Is writing prompt really making art? Lecture notes in computer science, 13988, 196-211.
O’Hear, Anthony (1995). Art and technology: An old tension. Royal institute of philosophy supplement, 38, 143-158.
Zhou, Yongchao, Andrei Muresanu, Ziwen Han, Keiran Paster, Silviu Pitis, Harris Chan & Jimmy Ba (2023). Large language models are human-level prompt engineers. Eleventh conference on learning representation. Recuperado de https://arxiv.org/pdf/2211.01910.pdf el 6/6/2023.
Bianchi, Federico, Pratyusha Kalluri, Esin Durmus, Faisal Ladhak, Myra Cheng, Debora Nozza, Tatsunori Hashimote, Dan Jurafksy, James Zou, & Aylin Caliskan (2023). Easily accessible text-to-image generative amplifies demographic stereotypes at large scale. En The 2023 ACM conference on Fairness, Accountability, and Transparency. ACM FAccT 2023. Recuperado de https://dl.acm.org/doi/pdf/10.1145/3593013.3594095 el 6/6/2023.