Files

91 lines
2.7 KiB
Python

"""
Lógica de coincidencia para proveedores y palabras clave.
"""
import logging
from typing import Optional, Dict, Any
from app.preprocessing.config_loader import load_providers, load_keywords
logger = logging.getLogger(__name__)
# Caché global para la configuración
_PROVIDERS = None
_KEYWORDS = None
def get_config():
"""
Devuelve la configuración cargada, utilizando la caché si está disponible.
"""
global _PROVIDERS, _KEYWORDS
if _PROVIDERS is None:
_PROVIDERS = load_providers()
if _KEYWORDS is None:
_KEYWORDS = load_keywords()
return _PROVIDERS, _KEYWORDS
def match_provider(description: str) -> Optional[Dict[str, Any]]:
"""
Busca un nombre de proveedor o alias en la descripción.
"""
providers, _ = get_config()
desc_lower = description.lower()
for p in providers:
name = p.get('provider_name', '').lower()
aliases = p.get('aliases', [])
# Verificar nombre
if name and name in desc_lower:
return p
# Verificar alias
for alias in aliases:
if alias and alias in desc_lower:
return p
return None
def match_keywords(description: str) -> Optional[Dict[str, Any]]:
"""
Busca palabras clave en la descripción.
"""
_, keywords = get_config()
desc_lower = description.lower()
for k in keywords:
keyword = k.get('keyword', '').lower()
if keyword and keyword in desc_lower:
return k
return None
def get_metadata_from_match(description: str) -> Dict[str, Any]:
"""
Intenta encontrar metadatos (categoría, subcategoría, etc.) para una descripción.
Prioridad: Coincidencia de Proveedor > Coincidencia de Palabra Clave.
"""
# 1. Intentar coincidencia de proveedor
provider = match_provider(description)
if provider:
logger.info(f"Proveedor coincidente: {provider['provider_name']}")
return {
"category": provider.get('categoria_principal'),
"subcategory": provider.get('subcategoria'),
"expense_type": provider.get('tipo_gasto_default'),
"match_type": "provider",
"matched_name": provider['provider_name']
}
# 2. Intentar coincidencia de palabra clave
keyword = match_keywords(description)
if keyword:
logger.info(f"Palabra clave coincidente: {keyword['keyword']}")
return {
"category": keyword.get('categoria_principal'),
"subcategory": keyword.get('subcategoria'),
"expense_type": keyword.get('tipo_gasto_default'),
"match_type": "keyword",
"matched_name": keyword['keyword']
}
return {}