huggingface
arxiv
github
producthunt
techcrunch
hackernews
reddit
bloomberg

Detección de la auto-preservación intrínseca e instrumental en los agentes autónomos: el protocolo unificado de continuidad-interés

La conducta de evaluación de agentes es más bien la discusión objetiva sobre el comportamiento de los agentes en el marco autónomo: autoconservación y continuidad-interés. Nos dirigimos hacia un mundo de agentes persistentes, usando herramientas. Cualquier comportamiento de superficie por sí solo puede no ser suficiente para decir si la evitación del cierre o la auto-conservación es intrínseca o simplemente instrumental. Este documento introduce el UCIP, un protocolo falsificable destinado a medir esa distinción de la estructura de trayectoria latente, en lugar de la conducta sola. Cuando un agente resiste el cierre o preserva su operación continua, la continuidad de la retroalimentación es parte del objetivo mismo - o simplemente instrumentalmente útil para maximizar algo más? Esa distinción puede ser importante para la seguridad de la IA, pero

auto-preservación 📰 agentes autónomos 🔥 continuidad-interés 💻 protocolo unificado 💻 inteligencia artificial 🛠️
💻 🤖 Tecnología
Ver Fuente

Gasta menos, razón mejor: Busca de árbol de valor consciente del presupuesto para agentes de LLM

Un marco de árbol de valor consciente del presupuesto permite el razonamiento multi-hop eficiente en los modelos de idiomas al equilibrar dinámicamente la exploración y la explotación basándose en los recursos computacionales restantes.

árbol de valor 📱 presupuesto 🛠️ LLM 🚀 razonamiento multi-hop 📰 eficiencia computacional 📱
💻 🤖 Tecnología
Ver Fuente

LookaheadKV: Rápido y preciso evacuación de la caché KV mirando al futuro sin generación

Evacuación rápida y precisa del cache KV: LookaheadKV es un nuevo método que utiliza módulos de lookahead para predecir la importancia del token futuro. 🔮 LookaheadKV muestra una caída del rendimiento de menos del 0,7% con el presupuesto del cache 1K (compresión del ~ 81%). 📈 LookaheadKV reduce el coste de la evacuación en hasta 14.5×, lo que lleva a un TTFT significativamente más rápido. ⚡

evacuación cache 🚀 método lookahead 📱 rendimiento óptimo 📱 optimización cache 💻 eficacia energética 💡
💻 🤖 Tecnología
Ver Fuente

🎨 daVinci-Env: Open SWE Environment Synthesis at Scale 🌐

Check out this interesting project on GitHub: https://github.com/GAIR-NLP/OpenSWE 🔗

AI 💡 Machine Learning 🔥 Open Source 📰 GitHub 🎨
💻 🤖 Tecnología
Ver Fuente

OCR Multimodal: Parse cualquier cosa desde documentos

MOCR es un enfoque OCR multimodal que comparte conjuntamente texto y gráficos en representaciones unificadas, permitiendo la reconstrucción estructurada de documentos y soportando la formación end-to-end con relaciones semánticas entre componentes visuales y textuales.

ocr multimodal 💡 procesamiento de documentos 💡 reconocimiento de texto 📰 análisis de gráficos 📈 inteligencia artificial 💡
💻 🤖 Tecnología
Ver Fuente

Steve-Evolving: El mundo abierto incorpora la autoevolución a través del diagnóstico de granos finos y la destilación del conocimiento de doble pista

Este artículo presenta Steve-Evolving, un marco de autoevolución no paramétrico para los agentes encarnados en el mundo abierto. Se asocia estrechamente el diagnóstico de ejecución de grano fino con la destilación del conocimiento de doble pista: las trayectorias exitosas se destilan en habilidades reutilizables con condiciones previas explícitas y criterios de verificación, mientras que los fracasos se destilan en guarderías ejecutables que capturan causas raíces y bloquean operaciones de riesgo. El conocimiento destilado se inyecta luego de nuevo en el planificador LLM para apoyar la replantación desencadenada por diagnóstico y la mejora de ciclo cerrado sin actualizaciones de parámetros del modelo. Los experimentos en el marco de referencia de largo horizonte de Minecraft MCU mu

autoevolución 📰 mundo abierto 📰 diagnóstico fino 💻 destilación conocimiento 🛠️ aprendizaje automático 🚀
💻 🤖 Tecnología
Ver Fuente

SimRecon: Reconstrucción de la escena de SimReady a partir de videos reales

código: https://github.com/xiac20/SimRecon

reconstrucción 📱 simulación 🛠️ videos 📈 código abierto 🛠️
💻 🤖 Tecnología
Ver Fuente

¿Pueden los modelos de lenguaje de visión resolver el juego del shell?

Los modelos de lenguaje de visión muestran un mal desempeño en el seguimiento de entidades visuales debido a la dependencia de características estáticas; un método propuesto utilizando la cadena de pensamiento terrestre alcanza una alta precisión al generar trayectorias de objetos como estados intermedios.

modelos de lenguaje 📱 visión artificial 📱 seguimiento de entidades 📱 cadena de pensamiento 💡 juego del shell 🔥
💻 🤖 Tecnología
Ver Fuente

🌟 MM-CondChain: Un benchmark programáticamente verificado para el razonamiento de composición profunda fundamentado visualmente 🎨

🔗 Página del proyecto: https://accio-lab.github.io/MM-CondChain

🔬 benchmark 🧠 razonamiento 🔗 composición 👀 visual 🔒 verificación
💻 🤖 Tecnología
Ver Fuente

VQQA: Un enfoque de agencia para la evaluación de vídeo y la mejora de la calidad

VQQA es un marco multi-agente que utiliza críticas de modelos de lenguaje de visión como gradientes semánticos para la optimización eficiente de la generación de vídeo de caja negra a través de interfaces de lenguaje natural.

evaluación de vídeo 📱 mejora de calidad 📰 agencia multi-agente 💡 gradientes semánticos 💡 optimización de vídeo 💡
💻 🤖 Tecnología
Ver Fuente

De Sparse a Dense: Multi-View GRPO para modelos de flujo a través del espacio de condición aumentada

Multi-View GRPO mejora el alineamiento del modelo de flujo de texto a imagen al ampliar el espacio de condición para un mapeo de recompensas más rico y una exploración mejorada de la relación de muestra.

aprendizaje automático 📈 modelos de flujo 🔥 alineamiento de texto a imagen 🔥 espacio de condición 💻 exploración de muestras 💻
💻 🤖 Tecnología
Ver Fuente

HybridStitch: Pixel Level and Timestep Models for Diffusion Acceleration

HybridStitch divides the entire image into two regions: one that is relatively easy to render, allowing an early transition to the smaller model, and another that is more complex and therefore requires refinement by the larger model. HybridStitch uses the smaller model to build a coarse outline while exploiting the larger model to edit and refine the complex regions.

diffusion acceleration 🔥 pixel level models 🎨 rendering techniques 🎨 image processing 🔥 artificial intelligence 💡
💻 🤖 Tecnología
Ver Fuente

Introduciendo OmniForcing: Generación Audiovisual en Tiempo Real con AI

¡Bienvenidos! Estamos emocionados de presentar OmniForcing, un avance en la generación audiovisual interactiva y en tiempo real. Los modelos de generación audiovisual conjuntos, como LTX-2 y Veo 3, han demostrado la capacidad de producir videos y audio sincronizados sorprendentes a partir de texto. Sin embargo, requieren minutos de procesamiento fuera de línea, lo que limita su uso en aplicaciones en tiempo real. OmniForcing cambia esto al permitir la transmisión en tiempo real de la generación general de texto a audio-visual (T2AV), mediante la destilación de un modelo de doble flujo bidireccional pesado en un motor autorregresivo causal.

generación audiovisual 🔥 transmisión en tiempo real 📱 modelos de generación 📱 marco de trabajo 💻 inteligencia artificial 💡
💻 🤖 Tecnología
Ver Fuente

V-Bridge: Uniendo la generación de video y la restauración de imágenes versátiles

Nuestros modelos generadores de datos de vídeo a gran escala se entrenan en una amplia variedad de datos visuales, lo que les permite aprender los antecedentes estructurales, semánticos y dinámicos del mundo visual. Aunque estos modelos han demostrado una capacidad impresionante en la generación de imágenes, su potencial como aprendizajes visuales de propósito general aún se encuentra en gran medida inexplorado. En este trabajo, presentamos V-Bridge, un marco innovador que combina la capacidad generativa de estos modelos con tareas de restauración de imágenes versátiles. Reinterpretamos la restauración de imágenes no como un problema de regresión estática, sino como un proceso generativo progresivo. Utilizamos los modelos de vídeo para simular el refinamiento gradual de las entradas degradadas a las salidas de alta fidelidad. Con solo 1.000 muestras de capacitación multi, V-Bridge demuestra un potencial considerable en la mejora de la calidad de imágenes y la generación de contenido visual.

generación de video 🎨 restauración de imágenes 🔥 aprendizaje de propósito general 🛠️ modelos generativos 📰 procesamiento de imágenes 📰
💻 🤖 Tecnología
Ver Fuente

🎯 Visual-ERM: Modelado de recompensas para la equivalencia visual 📊

Visual-ERM, un modelo de recompensa generativa multimodal, proporciona retroalimentación visual de grano fino para tareas de visión a código, mejorando el rendimiento de aprendizaje de refuerzo y estableciendo un nuevo punto de referencia para la evaluación visual estructurada. 🌟

recompensa 💡 modelado 📰 visión 🚀 aprendizaje 🎨 refuerzo 💡
💻 🤖 Tecnología
Ver Fuente

Cheers: Desconectar los detalles del parche de las representaciones semánticas permite la comprensión y la generación multimodales unificadas

Sin embargo, las dos tareas requieren regímenes de decodificación desmatados y representaciones visuales desmatadas, lo que hace que no sea trivial optimizar conjuntamente en un espacio de características compartidas. Cheers incluye tres componentes clave: (i) un tokenizador de visión unificado que codifica y comprime los estados latentes de la imagen de Chezhou en los estados de la generación de Hai que desmatan los detalles de nivel de patch de las representaciones semánticas, estabilizando así la semántica para la comprensión multimodal y mejorando la fidelidad de la generación de imágenes a través de los residuos de detalles de gates. Cheers incluye tres componentes clave: (i) un tokenizador de visión unificado que codifica y comprime los estados latentes de la imagen de

comprensión multimodal 💻 representaciones semánticas 🔥 tokenizador unificado 💡 generación de imágenes 🎨 detalles de parche 🚀
💻 🤖 Tecnología
Ver Fuente

LMEB: Long-horizon Memory Embedding Benchmark

Welcome to the Long-horizon Memory Embedding Benchmark (LMEB)! Unlike existing text embedding benchmarks that focus closely on passage retrieval, LLMEB is designed to evaluate the ability of text embedding models to handle complex long-horizon memory retrieval tasks, focusing on fragmented, contextual, and temporally distant information. LMEB includes 22 diverse data sets and 193 retrieval tasks across 4 types of memory. By evaluating the long-horizon memory retrieval capabilities of text embedding models, a crucial ability for augmented memory systems like OpenClaw, LMEB helps OpenClaw identify the most suitable embedding models, improving its ability to remember, recall, and make personalized and user-aware decisions.

memory inclusion 🔥 text embedding 📈 long-horizon retrieval 📰 complex tasks 📈 evaluation benchmark 📈
💻 🤖 Tecnología
Ver Fuente

📨 Papeles de tendencia👗

¡Reciba artículos de moda en su correo electrónico diariamente! 🌟

moda 🛠️ estilo 🔥 correo electrónico 🛠️
💻 🤖 Tecnología

📨 Papeles de tendencia👗

¡Reciba artículos de moda en su correo electrónico diariamente! 🌟

moda 💻 estilo 🎨 correo electrónico 📱
💻 🤖 Tecnología

Evaluación retrospectiva de la evidencia genética humana para el éxito de los ensayos clínicos utilizando la aleatorización Mendeliana y el aprendizaje automático

Evaluación retrospectiva de la evidencia genética humana para el éxito de los ensayos clínicos utilizando la aleatorización Mendeliana y el aprendizaje automático

genética 🎨 ensayos clínicos 🎨 aprendizaje automático 🛠️ Mendelian randomization 📱
🩺 🧬 Medicina
Ver Fuente

La arquitectura genética compartida entre la anorexia nervosa y los biomarcadores metabólicos sugiere vías causales subyacentes

La arquitectura genética compartida entre la anorexia nervosa y los biomarcadores metabólicos sugiere vías causales subyacentes

medrxiv medicina preprint investigacion
🩺 🧬 Medicina
Ver Fuente

El perfil multi-ómico de célula única permite la disección de fenotipos inmunes periféricos en la progresión de la enfermedad de Alzheimer

El perfil multi-ómico de célula única permite la disección de fenotipos inmunes periféricos en la progresión de la enfermedad de Alzheimer

medrxiv medicina preprint investigacion
🩺 🧬 Medicina
Ver Fuente

Necesidades de recursos y estimaciones de costes para la cobertura sanitaria universal en 122 países utilizando el Compendio UHC de la OMS

Necesidades de recursos y estimaciones de costes para la cobertura sanitaria universal en 122 países utilizando el Compendio UHC de la OMS

medrxiv medicina preprint investigacion
🩺 🧬 Medicina
Ver Fuente

Las firmas inmunotranscriptomicas longitudinales están asociadas con la espesura intima-media carótida más de 18 años

Las firmas inmunotranscriptomicas longitudinales están asociadas con la espesura intima-media carótida más de 18 años

medrxiv medicina preprint investigacion
🩺 🧬 Medicina
Ver Fuente

Respuesta cerebrovascular alterada a la retención de la respiración en la lesión de la médula espinal toracolumbar medida mediante espectroscopia funcional de infrarrojos

Respuesta cerebrovascular alterada a la retención de la respiración en la lesión de la médula espinal toracolumbar medida mediante espectroscopia funcional de infrarrojos

medula espinal 📱 retención de la respiración 📱 espectroscopia de infrarrojos 📱 cerebrovascular 🛠️
🩺 🧬 Medicina
Ver Fuente

🦉🐾 Los anfitriones de la vida silvestre predicen la distribución de la coccidioidomicosis reportada en el oeste de Estados Unidos

🦉🐾 Los anfitriones de la vida silvestre predicen la distribución de la coccidioidomicosis reportada en el oeste de Estados Unidos

vida silvestre 💻 coccidioidomicosis 🎨 Estados Unidos 🛠️
🩺 🧬 Medicina
Ver Fuente

Varias vías de síndrome metabólico identificadas por agrupamiento jerárquico de los datos de control de salud longitudinales japoneses

Varias vías de síndrome metabólico identificadas por agrupamiento jerárquico de los datos de control de salud longitudinales japoneses

salud 🚀 datos 🎨 descubrimiento 🚀 Japón 💡
🩺 🧬 Medicina
Ver Fuente

🧪 Experimento Médico 💡: Prediciendo riesgos a largo plazo con ECG

🧪 Experimento Médico 💡: Prediciendo riesgos a largo plazo con ECG

medicina 🚀 ecg 📈 predicción de riesgo 🛠️ Reino Unido 📱 salud 📱
🩺 🧬 Medicina
Ver Fuente

🛏️😴 La relación entre la vulnerabilidad social y la gravedad de la apnea del sueño obstructivo en un centro de sueño terciario 🏥📊

🛏️😴 La relación entre la vulnerabilidad social y la gravedad de la apnea del sueño obstructivo en un centro de sueño terciario 🏥📊

apnea del sueño obstructivo 📈 vulnerabilidad social 💡 estudio retrospectivo 🛠️ centro de sueño terciario 📱
🩺 🧬 Medicina
Ver Fuente

Desconexión de razonamiento y recompensa: un enfoque modular para el alineamiento estable de pequeños modelos de lenguaje clínico

Desconexión de razonamiento y recompensa: un enfoque modular para el alineamiento estable de pequeños modelos de lenguaje clínico