感謝您的作品!
由於在 teaser 圖中看到疑似台灣的街景,因此想請教:未來是否有可能提供一個 train.py 腳本,讓使用者能自行訓練模型權重?
目前在 Hugging Face 平台上,只要輸入是街景圖,幾乎都必須額外提供一張遮罩圖(mask.png)才能獲得品質較佳的深度圖。
但我這邊擁有大量高解析度的 Google Street View 360° 全景圖(8192×4096)及其對應的深度圖(512×256),這些資料皆來自 Google 內部來源。
想請問:是否有機會利用這類大規模的全景圖與深度圖配對資料進行端到端訓練,進而讓模型無需依賴遮罩圖即可直接輸出高品質深度圖?
若有需要,我也很樂意私下提供這些 8K 全景圖與對應深度圖資料。
再次感謝您的貢獻!
感謝您的作品!
由於在 teaser 圖中看到疑似台灣的街景,因此想請教:未來是否有可能提供一個 train.py 腳本,讓使用者能自行訓練模型權重?
目前在 Hugging Face 平台上,只要輸入是街景圖,幾乎都必須額外提供一張遮罩圖(mask.png)才能獲得品質較佳的深度圖。
但我這邊擁有大量高解析度的 Google Street View 360° 全景圖(8192×4096)及其對應的深度圖(512×256),這些資料皆來自 Google 內部來源。
想請問:是否有機會利用這類大規模的全景圖與深度圖配對資料進行端到端訓練,進而讓模型無需依賴遮罩圖即可直接輸出高品質深度圖?
若有需要,我也很樂意私下提供這些 8K 全景圖與對應深度圖資料。
再次感謝您的貢獻!