Skip to content

Regression: Stellen aus XING/Stepstone/E-Mail werden komplett OHNE URL gespeichert (url-Feld leer) — blockiert stellenbeschreibung_nachladen (#622) und Öffnen der Anzeige #645

@MadGapun

Description

@MadGapun

Fix in v1.7.0-beta.71 (b4257fc, 2026-05-31)

Release v1.7.0-beta.71 · Commit b4257fc

Regression hinter #436: dort wurde nur Detection + Warnung gebaut, der eigentliche Per-Portal-Fallback existierte nur in monster.py / freelancermap.py. XING + Stepstone hatten ihn nie. Zusaetzlich verhinderten zwei stille Pfaffen ein manuelles Nachpflegen: update_job-Whitelist akzeptierte url nicht, stelle_bearbeiten kannte den Parameter gar nicht.

Was gefixt wurde

  • Scraper — URL-Fallback-Kaskade vereinheitlicht
    • xing.py _process_raw_job: Detail-Link -> jobId-basierte Rekonstruktion (https://www.xing.com/jobs/{jobId}) -> Such-URL + is_search_url=True. Relative Links absolutiert.
    • stepstone.py: alle drei Extraction-Strategien absolutieren Relative Links; leere Links -> aktuelle Such-URL + is_search_url=True. _fetch_detail_descriptions ueberspringt Such-URL-Stellen.
  • DB-SchichtDatabase.update_job nimmt url und is_search_url jetzt an (vorher silent Whitelist-Drop).
  • Toolsstelle_bearbeiten(<hash>, url="...") ist neu und setzt is_search_url automatisch. stellenbeschreibung_nachladen zeigt jetzt einen konkreten Copy-Paste-Vorschlag und einen separaten Fehler-Branch fuer Such-URL-Stellen (statt sinnlosem HTTP-Fetch der Suchseite).
  • Auto-Engine_run_auto_refetch_descriptions filtert COALESCE(is_search_url, 0) = 0.

Akzeptanzkriterien

  • XING- und Stepstone-Stellen speichern wieder Detail-URLs (mit jobId-Rekonstruktion + Absolutierung)
  • Fallback aus Bug: Stellen-URLs verlinken auf Suchergebnis-Seite statt auf konkrete Stellenanzeige #436 wiederhergestellt: keine Detail-URL -> Such-URL + is_search_url=True
  • Regressionstest (9 neue in tests/test_v17_url_regression_645.py) — volle Suite 1408 passed / 1 skipped
  • Nach URL-Fix: stellenbeschreibung_nachladen bekommt sauberen Hinweis-Pfad ueber stelle_bearbeiten(..., url=...) — der vorherige Workaround-Text war leer

Bewusst noch offen (eigene Issues empfohlen)

  • AK3 "E-Mail-Quelle ohne Link: definierter Umgang (Flag statt leerem Feld)" — Schema-Erweiterung mit eigener Migration, betrifft recruiter_anfrage_ablehnen und manuelle Anlagen
  • AK5 "Bestehende leere Stellen werden beim naechsten Scrape-Lauf nachgepflegt" — eigene Datenheilungs-Migration, analog zu quellen_aus_urls_korrigieren
  • medac/Workday-Deep-Link aus dem Zusatzvorschlag in #issuecomment-4582087088 — eigene Workday-Adapter-Untersuchung

Sofort-Workaround (medac, b32625de)

Mit beta.71 funktioniert jetzt:

stelle_bearbeiten("b32625de", url="https://medac.wd103.myworkdayjobs.com/medac_group/job/Wedel/Head-of-Master-Data-Management_R-2026-...")
stellenbeschreibung_nachladen("b32625de")

Metadata

Metadata

Assignees

No one assigned

    Labels

    bugSomething isn't working

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions