Skip to content

Eigene Job-Quellen: User kann Karriereseiten-URLs als Custom-Source hinzufuegen #627

@MadGapun

Description

@MadGapun

Beobachtung (User-Feedback 2026-05-11)

"Möglichkeit, eigene Jobseiten oder Quellen zur Suche hinzuzufügen, wäre hilfreich."

Aktuell hat PBP 33+ fest verdrahtete Scraper. User koennen via Settings -> Quellen aktivieren/deaktivieren, aber nicht eigene hinzufuegen — z.B. die Karriereseite eines bestimmten Mittelstaendlers, ein Branchen-Portal, ein Verband.

Optionen

Option A — Custom URL Scraper (Generic JSON-LD):

  • User gibt URL einer Karriereseite ein
  • PBP versucht JSON-LD JobPosting (Schema.org) zu parsen — die meisten modernen Greenhouse/Personio/SAP-SuccessFactors-Pages haben das
  • Falls erfolgreich: Quelle wird als "Custom: " gespeichert und bei jeder Suche mitgenutzt
  • Hilfsfunktion: quellen_health_check mit der URL als Pre-Check

Option B — Plugin-Plattform (#504):

  • Quellen als Sub-Add-Ins via Capability-Manifest
  • Drittentwickler/User koennen eigene Scraper-Plugins schreiben
  • Massivere Architektur-Aenderung, geplant fuer v1.8

Option C — Browser-Extension (Chrome-in-Claude):

  • Karriereseiten-Browse + Direct-Add via Chrome-Extension
  • Existiert teilweise schon (Claude-in-Chrome workflow)

Empfehlung

Phasenweise:

  1. v1.7-Patch: Direct-Add-from-URL fuer einzelne Stellen (existiert teilweise via stelle_manuell_anlegen) + besser sichtbar machen
  2. v1.7-Patch: JSON-LD-Reuse aus extract_jobposting_jsonld (Scraper-Konsolidierung: Retry, HTTP-Client-Helper, Health-Check (Audit-Findings 2026-05-10) #624 Phase 3) als "Custom URL Crawler" verkaufen — gibt URL-basierte Recurring-Quellen
  3. v1.8: Plugin-API fuer ausgereifte custom Scraper (Plugin-Plattform v1.7: Sub-Add-Ins ueber stabile Ingest-API + Capability-Manifest #504)

Akzeptanzkriterien (Phase 1+2)

  • Settings -> Quellen -> neuer Tab "Custom URLs"
  • Liste mit URL + Label + Active-Toggle
  • Health-Probe + JSON-LD-Detection zeigt vor Save was extrahierbar ist
  • Bei jeder jobsuche_starten werden custom URLs mit-gecrawlt

Quelle

User-Feedback Mail-Test 2026-05-11. Verwandt: #504 (Plugin-Plattform), #624 (JSON-LD-Helper).

Metadata

Metadata

Assignees

No one assigned

    Labels

    enhancementNew feature or requestscraperJob scraper related

    Projects

    No projects

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions