Metodología y transparencia
Cómo obtenemos los datos, qué hace la inteligencia artificial y cómo se calculan las métricas.
Aviso importante
El Centinela es una plataforma de monitoreo ciudadano independiente. No representa al Congreso de Colombia, a ningún partido político ni a ninguna entidad gubernamental. Los resúmenes y títulos simplificados de proyectos de ley son generados por inteligencia artificial y pueden contener errores o imprecisiones. Siempre contrasta con las fuentes oficiales enlazadas en cada página.
📂 Fuentes de datos
| Entidad | Fuente oficial | Actualización |
|---|---|---|
| Congresistas | senado.gov.co + camara.gov.co | Semanal |
| Proyectos de ley | leyes.senado.gov.co (Sistema de Información Legislativa) | Cada 6 horas |
| Votaciones Senado | datos.gov.co (dataset ucmr-52df) | Cada 6 horas |
| Votaciones Cámara | camara.gov.co | Cada 6 horas |
| Asistencia Senado | Gacetas del Congreso (imprenta.gov.co) | Cada 12 horas |
| Asistencia Cámara | camara.gov.co | Cada 12 horas |
| Partidos políticos | Derivados de la data oficial de congresistas | Semanal |
Todos los datos son de acceso público. No se recopila ni almacena información de ciudadanos.
🤖 Qué hace la inteligencia artificial
Los proyectos de ley tienen títulos técnicos y extensos. La IA genera una versión corta y en lenguaje cotidiano. Ejemplo: "Por medio de la cual se modifican los artículos 23 y 45 de la Ley 1341 de 2009..." → "Reforma al sistema de telecomunicaciones".
Un párrafo corto que explica de qué trata el proyecto, a quiénes afecta y cuál es su impacto potencial. Está diseñado para personas sin conocimiento jurídico.
Cada proyecto se asigna (cuando es posible) a una de las categorías temáticas cerradas del producto —por ejemplo salud, educación, presupuesto— usando un modelo de lenguaje sobre el título y el texto disponible. Esa categoría alimenta solo el factor 2 de la fórmula de relevancia (hasta 25 puntos), según una tabla fija publicada en el código. Si no hay categoría asignada o la confianza es baja, ese factor usa el puntaje mínimo. No mezcla comisión legislativa con tema de fondo.
El chat disponible en cada proyecto responde preguntas basándose exclusivamente en el texto oficial del documento (PDF). No inventa ni extrapola información fuera del texto. Si el PDF no está disponible o falló su extracción, el asistente no estará habilitado para ese proyecto.
🚫 Qué NO hace la inteligencia artificial
- ✗No calcula los scorecards de desempeño — son fórmulas matemáticas aplicadas sobre datos oficiales.
- ✗No calcula ni influye en el ranking de congresistas — el ranking se deriva de un score compuesto con pesos fijos (ver abajo).
- ✗No sustituye la fórmula de relevancia — el puntaje sigue siendo el resultado de 4 factores con reglas fijas (ver abajo). La IA solo puede proponer la etiqueta de tema dentro de categorías cerradas.
- ✗No edita, filtra ni omite datos del Congreso — muestra lo que existe en las fuentes oficiales.
- ✗No emite opiniones, juicios ni calificaciones sobre congresistas.
- ✗No responde preguntas fuera del texto del proyecto de ley en el asistente RAG.
🔥 Score de relevancia de proyectos
Cada proyecto recibe un puntaje de 0 a 100 basado en 4 factores objetivos. No refleja apoyo ni rechazo a ningún proyecto — mide su potencial de impacto basado en características formales.
El máximo teórico es 103 puntos (con bonus multipartidista), normalizado a 100.
📊 Métricas del scorecard de congresistas
| Métrica | Cómo se calcula |
|---|---|
| Tasa de asistencia | Sesiones con presencia o excusa justificada / total de sesiones con datos de asistencia publicados para su cámara. Solo se incluyen años con cobertura suficiente (para el Senado, desde 2024; para la Cámara, todos los años disponibles). Se requieren al menos 10 sesiones con datos para considerar la métrica representativa. |
| Participación en votaciones | Solo votaciones nominales (con registro individual). Entre esas votaciones, proporción en que consta voto sí, no o abstención, sobre el total de votaciones donde el congresista no figura como ausente. Las excusas cuentan en el denominador pero no en el numerador, reduciendo la tasa. |
| Proyectos como autor | Conteo de proyectos radicados donde figura como autor principal. |
| Proyectos como coautor | Conteo de proyectos radicados donde figura como coautor. |
| Proyectos avanzados | Proyectos de autoría (autor o coautor) que superaron al menos un debate (no están en estado "radicado" ni "archivado"). |
| Proyectos convertidos en ley | Proyectos de autoría propia (autor o coautor) que alcanzaron estado "Sancionado". |
| Alineación con el partido | Solo votaciones nominales. Porcentaje de veces que su voto coincide con la posición mayoritaria de su partido en esa votación (con al menos dos colegas con voto válido en la misma bancada). Solo se consideran votos efectivos (sí, no, abstención); ausencias y excusas se excluyen. |
| Cobertura de votaciones nominales | Porcentaje de las votaciones nominales del período en su cámara para las que existe registro de voto individual de este congresista. Da contexto: con cobertura baja, participación y alineación son menos representativas. |
🏅 Fórmula del ranking
El ranking de congresistas se calcula con un score compuesto de tres componentes con pesos fijos. No interviene inteligencia artificial.
Se generan dos rankings con DENSE_RANK: uno general (todos los congresistas) y uno por cámara (senado y cámara por separado). Si un componente no tiene datos, se toma como 0.
⚠️ Limitaciones conocidas
- •Los datos de asistencia dependen de las Gacetas del Congreso. Puede haber retrasos de semanas entre una sesión y su publicación oficial.
- •La asistencia del Senado en 2022 y 2023 tiene baja cobertura en las Gacetas (menor al 40 %), por lo que esos años se excluyen del cálculo de la tasa de asistencia para senadores. La cobertura mejora significativamente a partir de 2024.
- •Las votaciones de la Cámara de Representantes tienen menor cobertura histórica que las del Senado por diferencias en los sistemas de publicación.
- •Muchas decisiones en comisión o plenaria son por votación ordinaria (a mano alzada o unánime) sin publicación nominal; el sitio lo marca explícitamente y no inventa votos individuales.
- •La vinculación de congresistas a votaciones y asistencia se hace por coincidencia de nombre. Diferencias de formato entre fuentes pueden ocasionar que algunos registros no se enlacen correctamente.
- •Los títulos y resúmenes generados por IA pueden no capturar matices jurídicos complejos. Son aproximaciones en lenguaje ciudadano, no interpretaciones legales.
- •El asistente RAG depende de la extracción exitosa del PDF del proyecto. Algunos PDFs escaneados pueden tener errores de OCR, y otros pueden no estar disponibles para descarga.
- •El score de relevancia es una herramienta de ordenamiento, no un juicio de valor. Proyectos con score bajo pueden ser igualmente importantes según el contexto.
- •Los datos del período 2026-2030 estarán disponibles desde el 20 de julio de 2026 (posesión del nuevo Congreso).
¿Encontraste un error?
Si detectas un dato incorrecto o una imprecisión en un resumen generado por IA, te invitamos a verificarlo con la fuente oficial y reportarlo. Esta plataforma es un proyecto de transparencia ciudadana en mejora continua.