Fresh start - excluded large ROM JSON files

2026-04-11 09:45:12 -05:00
commit 5deb387aa6
395 changed files with 47744 additions and 0 deletions
--- a/tools/shipping_tracker.py
+++ b/tools/shipping_tracker.py
@@ -0,0 +1,369 @@
+#!/usr/bin/env python3
+"""Shipping Tracker - Checks Proton Mail for tracking emails"""
+
+import socket
+import sqlite3
+import re
+import json
+import os
+from email import policy
+from email.parser import BytesParser
+from datetime import datetime
+from urllib.parse import urlparse
+
+# Config
+IMAP_HOST = "127.0.0.1"
+IMAP_PORT = 1143
+USERNAME = "alexthenerdyai@proton.me"
+PASSWORD = "8yiNBTJBMc6HyOQjIZKjMw"
+DB_PATH = os.path.expanduser("~/.openclaw/workspace/data/shipping.db")
+CHANNEL_ID = "1473701182076752135"
+
+# Tracking patterns
+CARRIERS = {
+    'ups': {
+        'patterns': [r'1Z[A-Z0-9]{16}', r'\b1Z[0-9A-Z]{16}\b'],
+        'domains': ['ups.com', 'email.ups.com'],
+        'name': 'UPS'
+    },
+    'fedex': {
+        'patterns': [r'\b\d{12}\b', r'\b\d{14}\b', r'\b\d{20}\b'],
+        'domains': ['fedex.com', 'email.fedex.com'],
+        'name': 'FedEx'
+    },
+    'usps': {
+        'patterns': [r'\b\d{20,22}\b', r'\b9\d{15,21}\b', r'\b[A-Z]{2}\d{9}[A-Z]{2}\b'],
+        'domains': ['usps.com', 'email.usps.gov'],
+        'name': 'USPS'
+    },
+    'dhl': {
+        'patterns': [r'\b\d{10}\b', r'\b\d{11}\b'],
+        'domains': ['dhl.com', 'dhl-usa.com'],
+        'name': 'DHL'
+    },
+    'amazon': {
+        'patterns': [r'\b\d{12,14}\b'],
+        'domains': ['amazon.com', 'amazon.ca', 'amazon.co.uk'],
+        'name': 'Amazon Logistics'
+    },
+    'ontrac': {
+        'patterns': [r'\bC\d{14}\b', r'\bD\d{14}\b'],
+        'domains': ['ontrac.com'],
+        'name': 'OnTrac'
+    },
+    'lasership': {
+        'patterns': [r'\b1LS\d{12}\b', r'\bLX\d{8,12}\b'],
+        'domains': ['lasership.com'],
+        'name': 'LaserShip'
+    }
+}
+
+# Date patterns for estimated delivery
+DATE_PATTERNS = [
+    r'(?:arriving|delivery|delivered by|estimated delivery)[\s:]*(?:on|by)?\s*(monday|tuesday|wednesday|thursday|friday|saturday|sunday)?[,\s]*([a-z]+)\s+(\d{1,2})[,\s]+(\d{4})',
+    r'(?:arrives|delivery on|by)\s+(\w+)\s+(\d{1,2})',
+    r'(?:expected|estimated|delivery)[\s:]*(\d{1,2})[\/\-](\d{1,2})[\/\-](\d{2,4})',
+    r'(?:will arrive|delivered)\s+(?:on\s+)?(\w+day),?\s*(\w+)\s*(\d{1,2})',
+]
+
+def init_db():
+    """Initialize SQLite database"""
+    os.makedirs(os.path.dirname(DB_PATH), exist_ok=True)
+    conn = sqlite3.connect(DB_PATH)
+    conn.execute('''
+        CREATE TABLE IF NOT EXISTS shipments (
+            id INTEGER PRIMARY KEY AUTOINCREMENT,
+            message_id TEXT UNIQUE,
+            sender TEXT,
+            sender_email TEXT,
+            subject TEXT,
+            carrier TEXT,
+            tracking_number TEXT,
+            estimated_delivery TEXT,
+            tracking_url TEXT,
+            received_at TEXT,
+            notified_at TEXT,
+            delivered INTEGER DEFAULT 0
+        )
+    ''')
+    conn.commit()
+    conn.close()
+
+def get_response(sock, tag):
+    """Read IMAP response until tag"""
+    response = b""
+    while True:
+        chunk = sock.recv(16384)
+        if not chunk:
+            break
+        response += chunk
+        if tag.encode() in response:
+            break
+    return response
+
+def extract_rfc822(data):
+    """Extract email from IMAP FETCH response"""
+    lines = data.split(b'\r\n')
+    email_lines = []
+    collect = False
+    for line in lines:
+        if b'FETCH' in line and b'RFC822' in line:
+            collect = True
+            continue
+        if line.startswith((b'A4 ', b'A5 ', b'A6 ', b'A7 ')) and b'OK' in line:
+            break
+        if collect:
+            email_lines.append(line)
+    return b'\r\n'.join(email_lines)
+
+def strip_html(html):
+    """Convert HTML to plain text"""
+    import re
+    html = re.sub(r'<(style|script)[^>]*>[^<]*</\1>', ' ', html, flags=re.IGNORECASE | re.DOTALL)
+    html = re.sub(r'</(p|div|h[1-6]|li|tr|br)>', '\n', html, flags=re.IGNORECASE)
+    html = re.sub(r'<[^>]+>', ' ', html)
+    html = re.sub(r'\s+', ' ', html)
+    return html.strip()
+
+def parse_email(msg):
+    """Extract email content"""
+    body = ''
+    if msg.is_multipart():
+        for part in msg.walk():
+            content_type = part.get_content_type()
+            if content_type == 'text/plain':
+                payload = part.get_payload(decode=True)
+                if payload:
+                    body += payload.decode('utf-8', errors='ignore')
+            elif content_type == 'text/html':
+                payload = part.get_payload(decode=True)
+                if payload:
+                    body += strip_html(payload.decode('utf-8', errors='ignore'))
+    else:
+        payload = msg.get_payload(decode=True)
+        if payload:
+            body = payload.decode('utf-8', errors='ignore')
+    return body
+
+def detect_carrier(from_email, body, subject):
+    """Detect carrier from email domain and content"""
+    domain = from_email.split('@')[-1].lower() if '@' in from_email else ''
+    text = f"{subject} {body}".lower()
+    
+    for carrier_id, info in CARRIERS.items():
+        # Check domain
+        if any(d in domain for d in info['domains']):
+            return carrier_id
+        # Check for carrier name in text
+        if carrier_id in text or info['name'].lower() in text:
+            return carrier_id
+    
+    return None
+
+def extract_tracking(body, carrier_id):
+    """Extract tracking number from email body"""
+    if not carrier_id or carrier_id not in CARRIERS:
+        # Try all patterns
+        for cid, info in CARRIERS.items():
+            for pattern in info['patterns']:
+                match = re.search(pattern, body, re.IGNORECASE)
+                if match:
+                    return match.group(0), cid
+        return None, None
+    
+    # Use carrier-specific patterns
+    for pattern in CARRIERS[carrier_id]['patterns']:
+        match = re.search(pattern, body, re.IGNORECASE)
+        if match:
+            return match.group(0), carrier_id
+    
+    return None, carrier_id
+
+def extract_delivery_date(body):
+    """Extract estimated delivery date from email"""
+    text = body.lower()
+    months = ['january', 'february', 'march', 'april', 'may', 'june',
+              'july', 'august', 'september', 'october', 'november', 'december',
+              'jan', 'feb', 'mar', 'apr', 'may', 'jun', 'jul', 'aug', 'sep', 'oct', 'nov', 'dec']
+    
+    for pattern in DATE_PATTERNS:
+        match = re.search(pattern, text)
+        if match:
+            return match.group(0).strip()
+    
+    return None
+
+def get_tracking_url(carrier, tracking_num):
+    """Generate tracking URL for carrier"""
+    urls = {
+        'ups': f'https://www.ups.com/track?tracknum={tracking_num}',
+        'fedex': f'https://www.fedex.com/fedextrack/?trknbr={tracking_num}',
+        'usps': f'https://tools.usps.com/go/TrackConfirmAction?tLabels={tracking_num}',
+        'dhl': f'https://www.dhl.com/en/express/tracking.html?AWB={tracking_num}',
+        'amazon': f'https://track.amazon.com/tracking/{tracking_num}',
+        'ontrac': f'https://www.ontrac.com/tracking/?number={tracking_num}',
+        'lasership': f'https://www.lasership.com/track/{tracking_num}'
+    }
+    return urls.get(carrier, None)
+
+def process_message(sock, msg_num, conn):
+    """Process a single email message"""
+    # Fetch full message
+    sock.send(f'A4 FETCH {msg_num} RFC822\r\n'.encode())
+    resp = get_response(sock, "A4 OK")
+    
+    email_data = extract_rfc822(resp)
+    if not email_data:
+        return None
+    
+    try:
+        msg = BytesParser(policy=policy.default).parsebytes(email_data)
+    except:
+        return None
+    
+    message_id = msg.get('Message-ID', '').strip('<>')
+    if not message_id:
+        return None
+    
+    # Check if already processed
+    cursor = conn.execute('SELECT 1 FROM shipments WHERE message_id = ?', (message_id,))
+    if cursor.fetchone():
+        return None
+    
+    # Parse email
+    sender_email = msg.get('From', '')
+    sender_name = sender_email.split('<')[0].strip() if '<' in sender_email else sender_email
+    subject = msg.get('Subject', '(No Subject)')
+    body = parse_email(msg)
+    
+    # Detect carrier and tracking
+    carrier_id = detect_carrier(sender_email, body, subject)
+    tracking_num, carrier_id = extract_tracking(body, carrier_id)
+    
+    if not tracking_num:
+        return None
+    
+    est_delivery = extract_delivery_date(body)
+    tracking_url = get_tracking_url(carrier_id, tracking_num)
+    
+    # Save to database
+    carrier_name = CARRIERS.get(carrier_id, {}).get('name', carrier_id.upper())
+    
+    conn.execute('''
+        INSERT INTO shipments (message_id, sender, sender_email, subject, carrier, 
+                              tracking_number, estimated_delivery, tracking_url, 
+                              received_at, notified_at)
+        VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?)
+    ''', (
+        message_id, sender_name, sender_email, subject, carrier_name,
+        tracking_num, est_delivery, tracking_url,
+        datetime.now().isoformat(), datetime.now().isoformat()
+    ))
+    conn.commit()
+    
+    return {
+        'sender': sender_name,
+        'carrier': carrier_name,
+        'tracking': tracking_num,
+        'estimated': est_delivery or 'Unknown',
+        'url': tracking_url,
+        'subject': subject
+    }
+
+def format_notification(shipment):
+    """Format shipment for Discord notification"""
+    lines = [
+        f"\ud83d\ude9a **New Shipment Detected**",
+        f"",
+        f"**From:** {shipment['sender']}",
+        f"**Carrier:** {shipment['carrier']}",
+        f"**Tracking:** `{shipment['tracking']}`",
+        f"**Est. Delivery:** {shipment['estimated']}"
+    ]
+    
+    if shipment['url']:
+        lines.append(f"**Track:** <{shipment['url']}>")
+    
+    return '\n'.join(lines)
+
+def send_discord_notification(content, channel_id):
+    """Send notification to Discord (placeholder - will use message tool or sessions)"""
+    # This will be called via sessions_send or we can write to a file for cron
+    print(f"[NOTIFY] Channel {channel_id}: {content[:100]}...")
+    return True
+
+def main():
+    init_db()
+    conn = sqlite3.connect(DB_PATH)
+    
+    print(f"[{datetime.now().strftime('%Y-%m-%d %H:%M')}] Checking for new shipments...")
+    
+    try:
+        # Connect to IMAP
+        sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
+        sock.settimeout(15)
+        sock.connect((IMAP_HOST, IMAP_PORT))
+        sock.recv(1024)
+        
+        # Login
+        sock.send(f'A1 LOGIN "{USERNAME}" "{PASSWORD}"\r\n'.encode())
+        get_response(sock, "A1 OK")
+        
+        # Select INBOX
+        sock.send(b'A2 SELECT "INBOX"\r\n')
+        get_response(sock, "A2 OK")
+        
+        # Search unread messages
+        sock.send(b'A3 SEARCH UNSEEN\r\n')
+        resp = get_response(sock, "A3 OK").decode()
+        
+        msg_nums = []
+        for line in resp.split('\r\n'):
+            if 'SEARCH' in line and '*' in line:
+                parts = line.split('SEARCH')
+                if len(parts) > 1:
+                    msg_nums = [n for n in parts[1].strip().split() if n.isdigit()]
+        
+        if not msg_nums:
+            print("[INFO] No unread messages")
+            conn.close()
+            return []
+        
+        print(f"[INFO] {len(msg_nums)} unread messages to check")
+        
+        shipments = []
+        for msg_num in msg_nums:
+            shipment = process_message(sock, msg_num, conn)
+            if shipment:
+                shipments.append(shipment)
+                print(f"[FOUND] {shipment['carrier']} - {shipment['tracking']}")
+        
+        # Logout
+        sock.send(b'A5 LOGOUT\r\n')
+        sock.close()
+        
+        # Output results for Discord
+        if shipments:
+            output = {'channel': CHANNEL_ID, 'shipments': shipments}
+            output_path = os.path.expanduser('~/.openclaw/workspace/data/shipping_output.json')
+            with open(output_path, 'w') as f:
+                json.dump(output, f)
+            print(f"[INFO] Found {len(shipments)} shipments, saved to {output_path}")
+        else:
+            print("[INFO] No new shipments found")
+        
+        return shipments
+        
+    except Exception as e:
+        print(f"[ERR] {e}")
+        import traceback
+        traceback.print_exc()
+        return []
+    finally:
+        conn.close()
+
+if __name__ == "__main__":
+    shipments = main()
+    if shipments:
+        for s in shipments:
+            print("\n" + format_notification(s))