Ir al contenido

Pipeline de Pedidos HES

Flujo: Email → PDF → RAW → Business (Dedup Trío) → Google Sheets (FACTURACIÓN)

:::note F2.4 — Migrado al patrón Hexagonal (2026-05-28) domains/pedidos_hes/pipeline.py ahora usa IMAPConnector directo en vez del shim run_imap_ingest. El stage ingest delega a ingest_with_connector(...). Único hook custom: extract_attachments=self._extract_excel_attachments (parsea tablas Excel Chiloé EDP NNSS); body_text_from/date_iso_from quedan en defaults. Los stages final() (incl. save_pedidos_hes productivo) y publish() (GSheets) NO tocan IMAP y quedaron sin cambios. Migrado en ciclo combinado con pedidos_SAP. Ver Plan-Migracion-F2.2-F2.6 §F2.4 y ADR-Source-Connectors. Capability imap-connector sin delta. Engram archive #1281, PR #49. :::

imap_client.py descarga correos HES con adjuntos PDF y tablas HTML.

parse_pedidos_HES_tables.py / parse_pedidos_HES_mails.py extraen número de pedido, HES y monto.

process_pedidos_HES_from_raw.py consolida y normaliza los campos.

business_pedidos_HES.py aplica dedup por (N° Pedido, HES, Monto). La Fecha Recepción corresponde a la primera aparición consolidada del trío.

Lookup contra CT nube para asignar Proceso/Zona; fallback por keywords si falla el lookup.

excel_writer_pedidos_HES.pySALIDAS/.

Actualización automática a Drive: Como parte del pipeline pedidos_HES, el script ACTUALIZAR_FACTURACION_HES.py se ejecuta automáticamente como post-step para hacer append a la hoja FACTURACIÓN con formato y “filtro verde”.

Regla Crítica de Negocio: El Trío Definitivo

Sección titulada «Regla Crítica de Negocio: El Trío Definitivo»

Para evitar duplicados y errores de monto, se utiliza el Dedup por Trío: (N° Pedido, HES, Monto).

Tags: #hes #pedidos #business-rules #dedup