Ir al contenido

Diccionario de Tablas y Estructuras (IngelCoding)

Fuentes: SQLite (originales) + PostgreSQL (migración)

ArchivoRutaTamañoTablas
data_warehouse.dbSALIDAS/db/3.22 MB9
pedidos_SAP.dbSALIDAS/db/curated/2.44 MB3
pedidos_HES.dbSALIDAS/db/curated/1.37 MB3
facturacion.dbSALIDAS/db/curated/1.25 MB1
ingeldata.dbSALIDAS/db/0.31 MB4

Total: 8.91 MB, 32 tablas

ConfigValor
Servidorlocalhost:5432
Base de datosingelcoding
Usuarioingeluser
Puerto GatewayOn-Premises Data Gateway

Tablas migradas:

  • dim_calendario: 4,018 filas
  • dim_gantt: 9,603 filas
  • fact_facturas: 6,345 filas
  • Total: 19,966 filas
TablaDescripciónColumnas
dim_calendarioDimensión temporalFecha, Ano, Mes, Dia, Dia_Semana, Trimestre, Semana_Anio, Es_Finde, Es_Feriado
dim_ganttPlanificación Gantt33 columnas: OT_Proyecto, Descripcion, Actividades, Duracion, Brigada, Supervisor, Estado_PMO, etc.
dim_otDimensión central de OTsid, proyecto_original, ot_limpia, tipo, zonal, fuente
dim_personal_brigadasPersonal y brigadasRUT, Nombre, id_Brigada, Cargo, Fecha_Inicio, Fecha_Termino, Vehiculos
CampoTipoDescripción
idINTEGERPrimary key
proyecto_originalTEXTDescripción del proyecto (NOMBRE_PROYECTO… para CTO, Descripcion para Gantt/Fact)
ot_limpiaTEXTOT individual extraída (key para cruces)
tipoTEXTClasificación: OT, OA, MAN, LITERAL
zonalTEXTOSORNO / CASTRO / ANCUD / vacío
fuenteTEXTCTO / GANTT / FACTURACION
extraido_deTEXTTexto original de la columna OT antes del split por ;
TablaZonaColumnas clave
dim_control_ots_ancudAncudOT, proyecto, supervisor, cuadratura, finiquito, monto facturado
dim_control_ots_castroCastroMismo esquema que Ancud
dim_control_ots_osornoOsorno+ proceso, capataz, supervisor_saesa, materiales
TablaDescripción
fact_facturacionFacturación real por OT (HES, monto, fecha ejecución)
fact_facturasCabeceras de facturas SAP
fact_notas_creditoNotas de crédito asociadas
fact_productividadPresupuesto inicial (HH OT) extraído de planilla Productividad
fact_costos_hhCostos operativos por Brigada × Mes — grano (zonal, id_Brigada, mes), 16 cols. Persiste ResultadoCostos.costo_por_hh vía export_costos(). Commit 64febc8. Ver Pipeline-Costos y ADR-Costos-Metas-a-DW
fact_productividad_diaria(En diseño) Derivada de fact_productividad × dim_gantt al grano Brigada × Día × OT. Ver Datos-Esperados-Productividad

Ver Modelo-Productividad-Rentabilidad para entender el cruce analítico de estas tablas de hechos.

VistaDefiniciónDescripción
metas_mesSELECT mes, zonal, id_Brigada, hb_dia_total FROM fact_costos_hhEquivalente de la hoja METAS MES de GSheets. Consumible por Power BI. Creada por export_costos().
TablaDescripción
SAP_CanceladosPedidos cancelados en SAP
SAP_ModificadosPedidos modificados
SAP_NuevosPedidos nuevos

11 columnas cada tabla (estado, pedido, monto, fecha, etc.)

TablaDescripción
HES_CanceladosHES cancelados
HES_ModificadosHES modificados
HES_NuevosHES nuevos

9 columnas cada tabla

TablaDescripción
FacturasFacturas procesadas (12 columnas)

5. ingeldata.db (Base operacional — escrita por core/sqlite_store.py)

Sección titulada «5. ingeldata.db (Base operacional — escrita por core/sqlite_store.py)»
TablaDescripción
raw_emails[obsoleta — pre-parquet] Emails crudos (20 columnas: id, subject, sender, date, body, folder)
processed_facturas[obsoleta — pre-parquet] Facturas procesadas (15 columnas)
processed_pedidos[obsoleta — pre-parquet] Pedidos procesados (12 columnas)
processed_hes[obsoleta — pre-parquet] HES procesados (11 columnas)
facturasTabla de dominio — facturas
pedidos_hesTabla de dominio — pedidos HES
pedidos_sapTabla de dominio — pedidos SAP
valorizacionesTabla de dominio — valorizaciones
gantt_actividadesTabla de dominio — actividades Gantt
pagos_pendientesTabla de dominio — pagos pendientes
pipeline_runsObservabilidad — 1 fila por run: status, ventana, fecha_source, scope_version
pipeline_stage_runsObservabilidad — 1 fila por stage por run (ingest/store/process/…)
publish_logObservabilidad — 1 fila por publicación: success/failed, error_msg, rows_published
raw_filesObservabilidad — 1 fila por archivo descargado + scope_version
scope_rebuild_historyObservabilidad — 1 fila por bump de scope: old/new scope, reason, bumped_by
dim_proceso_*Dimensiones de proceso (tablas múltiples)
proceso_*Tablas de proceso (tablas múltiples)
ot_no_parseablesOTs que no pudieron ser parseadas
_metadataMetadatos internos de la BD
sqlite_sequenceSecuencia interna SQLite (auto-generada)

Tabla pipeline_runs — Trazabilidad del Pipeline

Sección titulada «Tabla pipeline_runs — Trazabilidad del Pipeline»
ColumnaTipoDescripción
input_hashTEXTSHA256 del raw parquet de entrada
output_rowsINTEGERFilas del output procesado
raw_date_fromTEXTFECHA_DESDE usada en la ejecución
raw_date_toTEXTFECHA_HASTA usada
code_versionTEXTHash corto del commit git
usuarioTEXTABV del usuario IMAP (ING, MC, HC)

Ubicación: SALIDAS/processed/

Nueva estructura de parquets duraderos por dominio, con manifests:

  • SALIDAS/processed/{dominio}/{tabla}.parquet
  • SALIDAS/processed/{dominio}/_manifest.json (índice de versiones y fechas)