- Neuronautas
- Posts
- ✨ Voces que sienten: el salto emocional de la IA
✨ Voces que sienten: el salto emocional de la IA
Con etiquetas como [laughs] o [angry], Eleven v3 convierte texto en interpretación, ideal para medios creativos.
Del 2 al 9 de Junio
¿Qué es lo que se mueve?
🎙️ Eleven v3 (alpha). El nuevo modelo de voz de ElevenLabs añade etiquetas para indicar emoción como [whispers] o [excited]. Logra un nivel de expresividad sin precedentes. Mira el video.
🔌 Connectors en ChatGPT. Ahora puedes enlazar Drive, GitHub, SharePoint y más para buscar y citar tus propios archivos sin salir del chat.
🚀 Gemini 2.5 Pro. Nueva versión de Gemini rompiendo rankings de razonamiento y estrena “presupuestos de pensamiento” para equilibrar costo y latencia.
🐞 Cursor 1.0. BugBot para revisar PRs y proponer fixes con un clic, Background Agent para ejecutar tareas remotas, edición directa en Jupyter, y más.
🛠️ Codex para usuarios Plus y con acceso a Internet. Ahora el agente puede instalar dependencias, correr tests externos y actualizar paquetes.
🔊 Eleven v3 (alpha): Nuevo modelo de voz superexpresivo
ElevenLabs acaba de lanzar la versión v3 (alpha) de su modelo Text-to-Speech (Texto a Voz), que lleva la expresividad de las voces sintéticas a otro nivel.
Ahora puedes combinar 70+ idiomas, cambiar de hablante sobre la marcha y añadir etiquetas como [whispers]
, [excited]
o [sighs]
para controlar tono y emociones al detalle.
Durante junio, usarlo en la web cuesta 80 % menos y la API pública llegará pronto.
Eleven v3 necesita más prompt engineering y tiene mayor latencia, así que para chatbots en tiempo real sigue con v2.5 Turbo/Flash.
🎭 Audio tags: Ajusta susurros, gritos, risas o suspiros directamente en el guion.
🗣️ Modo diálogo: Nuevo endpoint que arma conversaciones multivoz con interrupciones y ritmo natural.
🌍 Cobertura global: 70+ lenguas mainstream listas para vídeos, audiolibros y accesibilidad.
⚡ Limitaciones hoy: Más lenta y menos fiable para uso en vivo; PVCs aún no optimizados.
Escucha la voz en este video.
🤝 Connectors: tu Drive, GitHub & más dentro de ChatGPT
Ahora el chatbot puede conectarse a tus fuentes de datos y buscarlas en tiempo real, desde un Doc en Drive hasta un PR en GitHub, sin salir de la conversación.
Piensa en un asistente que busca, cita y responde con la info exacta de tus propios archivos.
En esencia,
🔌 Conecta más de 15 apps (Drive, SharePoint, Dropbox, Box, GitHub…) y consulta todo desde el chat.
🧩 De cuatro maneras
Chat Search: búsquedas rápidas tipo “Encuentra el roadmap del Q2 en Drive”.
Deep Research: análisis pesado en proyectos complejos que requieren contexto de muchas fuentes.
Synced: genera índices de tus archivos para tener la información necesaria a la mano.
🔒 Privacidad: Para los usuarios en planes individuales (Gratis/Plus/Pro), tu info se utilizara para entrenar a ChatGPT si la opción Improve the model for everyone está activada. Y viene por defecto, por lo que asegúrate de ir a desactivarla antes de
Por el momento, la mayoría de estas apps solo están disponibles en el modo Deep Research para los planes individuales.
Cómo empezar
Settings → Connectors → Connect
Autentica tu cuenta externa
En el chat: Tools → Search connectors o Run deep research
Elige fuentes y pregunta. 📎 Dale clic a una cita para abrir el archivo original.
En resumen, Connectors convierte a ChatGPT en un buscador interno + analista sobre tus propios datos. Ideal para equipos que quieren respuestas con contexto real, sin cambiar de ventana.
🚀 Gemini 2.5 Pro: mejores rankings y nuevo “presupuesto de pensamiento”
Google liberó la versión previa de su modelo insignia antes del GA: escala benchmarks y da a los devs más control en costes/latencia.
Lo esencial
📈 +24 pts en LMArena → 1470 y +35 pts en WebDevArena → 1443; sigue #1 en ambos rankings.
👨💻 Líder en GPQA y HLE. Rankings en ciencia & razonamiento fuerte
⚙️ “Presupuestos de Razonamiento” para ajustar los tokens exactos que utiliza el modelo en su razonamiento.
✨ Respuesta más creativa y mejor formateada tras feedback de la versión de mayo.
📲 Ya disponible en la app Gemini y en API; versión estable llega “en un par de semanas”.
Comienza a usarlo ya
from google import genai
from google.genai import types
client = genai.Client()
response = client.models.generate_content(
model="gemini-2.5-pro-preview-06-05",
contents="Provide a list of 3 famous physicists and their key contributions",
config=types.GenerateContentConfig(
thinking_config=types.ThinkingConfig(thinking_budget=1024)
),
)
print(response.text)
Para programadores
🐞 Cursor 1.0: BugBot, agentes y Jupyter en piloto automático
La IDE con IA sube de versión y se convierte en un copiloto de código de tiempo completo: revisa PRs, corrige notebooks y hasta recuerda tus preferencias.
🆕 Lo esencial
🤖 BugBot: Revisa tus pull requests, detecta bugs y propone el fix con un clic en “Fix in Cursor”.
☁️ Background Agent para todos: ejecuta tareas asíncronas (linting, pruebas, despliegues) sin bloquear tu editor; se activa con el ícono de nube o
Cmd/Ctrl+E
.📓 Soporte en Jupyter: El agente crea y edita celdas: ideal para data science (solo con modelos Sonnet).
🧠 Memories (beta): Guarda datos clave por proyecto y los usa en futuras conversaciones.
⚡ MCP one-click + OAuth: Instala y configura servidores MCP vía OAuth con un solo botón.
🖼️ Respuestas Mejoradas: Diagramas Mermaid y tablas Markdown se renderizan directo en el chat.
📊 Nuevo Dashboard: Analíticas de uso, stats por modelo/herramienta y ajustes pulidos.
Para más, consulta la documentación oficial.
🛠️ Codex ya para usuarios Plus
OpenAI amplió Codex para Plus, Pro y Team y ofrece acceso a Internet durante la ejecución. Según el anuncio, Codex con internet ahora puede:
Instalar paquetes
pip
,npm
) sin salir del entorno.Ejecutar tests que dependen de datos externos.
Actualizar dependencias automáticamente.
Control granular: define dominios y métodos HTTP permitidos para mitigar riesgos.
La función se activa al crear o editar un entorno y está desactivada por defecto.
Aunque en fase inicial, Internet Access convierte a Codex en un agente de desarrollo más autónomo y potente.
Quizás quieras ver esto,
🧪 Apple descubrió que modelos como o3, Claude y DeepSeek R1 sufren caídas de precisión en tareas complejas y más bien empatan patrones que razonan.
🎤 ChatGPT Voice se actualiza con traducción en vivo, mejor ritmo y entonación, facilitando atención al cliente y presentaciones en varios idiomas sin complicaciones.
☁️ Google Colab ahora se conecta directo con Hugging Face para correr modelos instantáneamente, eliminando fricción en pruebas y despliegues sin salir del navegador.
Agenda de la Semana —
En colaboración con IAvanza

Cada semana, junto a IAvanza, destacamos eventos sobre
Inteligencia Artificial y emprendimiento para que
sigas creciendo con nosotros.
Conéctate, aprende y amplía tu red!
📌 Notion X AI
Webinar Gratuito impartido por Elier Fajardo
🗓 Martes, 10 de junio – 🕕 7:00 PM
🔗 Regístrate aquí: https://iavanza.do/formulario-webinar-semanal-iavanza
📌 Modelo Context Protocol (MCP): ¿qué es? y ¿para qué sirve?
Webinar Gratuito impartido por Jorge Vargas
🗓 Jueves, 12 de junio – 🕕 7:00 PM
🔗 Aparta tu cupo: https://iavanza.do/formulario-webinar-semanal-iavanza
🎯 Cupos limitados. No te quedes fuera.