跳到內容
平等EQUALITY 機會OPPORTUNITIES 獨立INDEPENDENCE
主頁 通訊刊物 無障礙數碼科技通訊 第217期 第一部份 (2025年10月版)

通訊刊物

第217期 第一部份 (2025年10月版)

 

香港失明人協進會
無障礙數碼科技通訊 第二百一十七期
Accessible Digital Technology Newsletter (AD Tech) Issue no.217
2025年10月

*************************************************************************

本會提供多項專為視障人士而設立的資訊科技服務,歡迎大家使用︰

聲聞通:以電話語音報讀方式,提供本港九家報章的即日新聞 (只限本會會員)。
電話號碼: (852)3707 4750

資訊科技諮詢電話—透過電話直接解答在電腦應用上遇到疑難的查詢。
電話號碼: (852)2709 5559

網頁無障礙設計主題網站: 提供無障礙網頁設計的指引,技巧和常遇問題等,供業界及市民參考。
https://gate.hkbu.org.hk/service/web

NVDA讀屏軟件下載及教學筆記
https://www.hkbu.org.hk/tc/service/technology/sub-page?page_id=nvda_modules_2021_08

*************************************************************************

如果你還沒有訂閱這份通訊,但希望定期收到這份通訊,可電郵至enewsletter@hkbu.org.hk,

於主題一欄輸入"訂閱通訊”,同時請留下你的姓名及聯絡電話。如果你是香港以外的朋友,請提供你所在之國家/地區,省份,城市等資料。

有關個人的資料僅用於編輯部和讀者間連系和本通訊發展之參考,本刊物將確保遵守香港《私隱條例》,資料將嚴格保密,不會用於其他用途,也不會在未經你的同意下提供給第三者。通訊將會在每月以電郵寄到訂戶之電郵信箱。另外,如你不再希望收到這份通訊,亦可電郵至香港失明人協進會enewsletter@hkbu.org.hk
,在主題一欄輸入"取消訂閱”或"unsubscribe”便可,記得也要提供你的姓名,閣下亦可於上述網址進行取消訂閱的手續。

*************************************************************************

編者的話

各位讀者大家好,本期通訊會繼續爲大家帶來10月最新的數碼科技資訊,内容包括AI最新資訊及科技產品資訊。本期亦會有MicrosoftEdge的專題特寫。



*************************************************************************

本期內容
甲部
視障輔助技術發展
1. AI 驅動微型視網膜植入物 PRIMA:為乾性黃斑點退化患者重燃閱讀之光
2. 教會生成式視覺語言模型「認得你那一件」——個人化物件定位新法,為助盲科技帶來精準導航
3. 阿曼 BankDhofar 銀行推出首款點字簽帳金融卡

乙部
專題特寫
MicrosoftEdge的三大好用智慧功能:沉浸式閱讀程式、大聲朗讀與CopilotVision
丙部
數碼科技剪報
1. 升線定降級?Apple TV+ 將變 Apple TV
2. FCC 擬撤銷香港電訊在美通訊牌 指與中國聯通有關聯涉國安風險
3. Google 將 Nano Banana 整合入 NotebookLM、Photos 及搜尋工具
4. NVIDIA 發佈全新最小型 AI 電腦 DGX Spark,售價為 $3,999
5. iPhone Air 內地 10 月 17 日預售,北上工作港人更適合購買?
6. TP-Link 越級挑戰 Wi-Fi 8,預告未來 Wi-Fi 追求「超高可靠性」
7. Google AI Mode 終於支援中文,同時也向更多地區開放

丁部
數碼世界消息
1. Adobe Premiere登錄流動裝置
2. Android上的Chrome現在可以利用人工智慧把網頁內容轉化為一段播客
3. Brave搜尋器推出「詢問Brave」
4. LinkedIn將會使用更多地區的用戶數據去訓練人工智慧
5. Perplexity發佈人工智慧電郵助理
6. WhatsApp現在可以為用戶翻譯聊天對話

*************************************************************************
甲部
視障輔助技術發展

1. AI 驅動微型視網膜植入物 PRIMA:為乾性黃斑點退化患者重燃閱讀之光

對於因乾性年齡相關黃斑點退化(AMD)嚴重階段「地理性萎縮」(GA)而喪失中央視力的長者,閱讀、辨識字母與在家居環境安全導航,往往成為難以重拾的日常。本月《新英倫醫學雜誌》(NEJM)刊登的一項歐洲多中心臨床試驗,帶來振奮人心的進展:由英國大學學院(UCL)及 Moorfields 眼科醫院團隊參與的研究顯示,一款名為 PRIMA 的無線光伏式次視網膜植入物,結合擴增實境(AR)眼鏡與口袋電腦之後,讓大部分受試者重新看見字母、數字與單詞,並重拾閱讀能力。

研究對象:共38名患者,分別於五個國家的17間醫院接受治療;Moorfields 為英國唯一試驗中心。
基線狀況:受試者在接受植入前,治療眼的中央視力已經喪失,只餘周邊視野。
主要成果:84% 參與者能以義眼視覺(prosthetic vision)重新辨識字母、數字與單詞;平均可在標準視力表上多讀5行。多名患者在手術前甚至無法分辨視力表。
安全性:沒有參與者出現剩餘周邊視力下降的情況。結果為未來監管審批與更廣泛臨床應用鋪路。

技術如何運作
植入物:PRIMA 為無線次視網膜光伏晶片,尺寸約2毫米×2毫米,厚度30微米(約半根人髮)。外形近 SIM 卡微縮版,置於死亡的光感受器下方的次視網膜層。
眼鏡與電腦:手術後患者佩戴配有攝影機的 AR 眼鏡;影像送往腰間的小型電腦,由內置 AI 演算法處理並轉換為近紅外光圖樣從眼鏡投射至晶片。
神經傳導:晶片將光能轉為電信號,經視網膜及視神經傳遞至大腦,形成可被解讀的視覺感知。
啟動與訓練:術後約一個月待眼睛癒合後啟動裝置;其後需數月復康訓練,包括掃讀文字與利用變焦功能放大字母。

手術程序:先行玻璃體切除術,再把晶片經小切口滑入黃斑中央下方;資深玻璃體視網膜外科醫生一般可於兩小時內完成。
復康關鍵:這並非「裝上晶片就立即看得清楚」;患者需要學習如何解讀新型視覺訊號,透過持續訓練重建閱讀策略。

來自 Moorfields 的患者 Sheila Irvine 描述,植入前如同中央有兩個黑盤遮擋;啟動後首次看見字母的那刻「死而復燃」般興奮。她現時挑戰閱讀處方箋、食品罐上的小字與填字遊戲,並表示心情與自信顯著改善,重拾「閱讀帶我去另一個世界」的感覺。

裝置開發:PRIMA 系統由 Science Corporation(science.xyz)研發,屬腦機介面與神經工程領域的醫療科技。
期刊論文:Frank G. Holz 等人,〈Subretinal Photovoltaic Implant to Restore Vision in Geographic Atrophy Due to AMD〉,《新英倫醫學雜誌》,2025;DOI: 10.1056/NEJMoa2501396。

這項來自 UCL 等歐洲團隊的臨床試驗,顯示 AI 加持的次視網膜光伏植入物 PRIMA,能在多數 GA(乾性 AMD)患者中恢復實用的閱讀能力,而且不影響周邊視野。隨著裝置邁向監管階段與更廣泛臨床應用,香港的數碼無障礙生態若能同步加強復康、介面設計與公共資訊可讀性,將可讓這項創新為視障社群帶來更全面的獨立與尊嚴。




2. 教會生成式視覺語言模型「認得你那一件」——個人化物件定位新法,為助盲科技帶來精準導航

當我們在狗公園一眼就認出自家法鬥「Bowser」,對AI而言卻未必容易。現今視覺—語言模型(VLM)雖善於辨識「一般類別」(如狗、杯),卻常常無法在新場景中準確鎖定「特定那一件」(例如你家的那隻狗、那個咖啡杯)。MIT、MIT-IBM Watson AI Lab、魏茲曼科學研究院等團隊提出一種全新的訓練方法,讓生成式VLM學會在少量範例的情況下,精準定位個人化物件,且不犧牲模型的其他通用能力。

以「影片追蹤」資料重新整理訓練集:從既有的目標追蹤影片擷取多張影格,讓同一物件在不同背景與情境中反覆出現,迫使模型依賴「脈絡線索」而非死記硬背的類別知識。
少量範例的情境學習(in-context):先提供幾張示例圖(例如你的寵物),再給一張新照片,要求模型在其中標出同一個體的位置。
防止「偷呃步」的命名策略:研究者用「假名」取代真實類別名(把老虎改稱為「Charlie」),切斷模型以既有類別聯想直接作答的捷徑,逼其回到影像脈絡來推理。
成效:在個人化定位任務中,平均準確率提升約12%;若加入「假名」資料,提升可達21%;模型越大,增益越明顯。研究將於國際計算機視覺會議(ICCV)發表。

為何重要:從「會認類別」走向「認得你的那一件」
跨場景的一致性:一般微調資料多為隨機靜態圖,缺乏對「同一件物品」的跨圖像對應訓練。新方法用連續影片的多情境樣本補上這個缺口。
保留通才能力:經此法再訓練後,模型原有的通用理解力不受破壞,等於在不「傷底子」的前提下,賦予它個體級定位的專長。
少量示例即可上手:更符合真實使用情境——用戶只需提供幾張參考照,就能在新場景中找到同一件物件。

室內助盲尋物:視障人士可用手機或穿戴式攝像裝置,讓模型在雜亂環境裡指認「我的白手杖」、「那本點字食譜」、「家中那個帶凸點的遙控器」。
公共空間導航:在港鐵站、商場、醫院等地,模型可根據用戶提供的少量範例,快速定位「那個帶我名字的背囊」、「預約號碼單」、「指定服務櫃檯」。
家居與長者照護:針對認知障礙或弱視長者,系統可協助尋找「常用藥盒」、「指定眼鏡」、「個人化餐具」,減少照護壓力。

語音回饋,搭配高對比度、放大模式與震動提示。
以隱私為先的裝置端(on-device/邊緣)推論,避免長時間上傳影像。
支援「少量即學」的用戶流程:拍3–5張參考圖、命名物件(可用用戶自訂稱呼),即時生效。
無障礙設計配套:為了讓模型輸出更易用,應在實體與數碼環境中同步優化,例如:
物件貼上高對比標記、加裝觸覺貼紙;
App 以大字體、清晰色階與簡化操作流程呈現定位結果與方向引導。

主要作者與合作單位:MIT、MIT-IBM Watson AI Lab、魏茲曼科學研究院、史丹福大學、特拉維夫大學、圖賓根AI中心、IBM Research、林茲約翰尼斯·開普勒大學等研究人員共同參與;資助部分由 MIT-IBM Watson AI Lab 提供。
研究焦點:釐清為何VLM不會自動承襲大型語言模型在情境學習上的優勢,並以資料設計與指令式調校(instruction-tuning)的角度,建立首個此任務基準並在多種開放與專有VLM上取得實證增益。

私隱與資料保護:應預設本地端推論、最小化資料留存,並提供一鍵刪除「個人化範例」。
安全與可靠:在醫療/照護場景部署前,需要實地驗證誤報與漏報率,並提供替代提示(聲音+觸覺)。
成本與普及:鼓勵公私營合作,把此類模型整合進現有讀屏器、導盲App與智慧眼鏡,並提供資助以降低弱勢社群的使用門檻。

這項於2025年10月16日公布的MIT研究,將「少量示例、跨場景鎖定同一物件」重塑為一個以影片追蹤資料驅動、避免類別先驗干擾的訓練問題,並帶來顯著準確率提升。對無障礙生態而言,它意味著更貼近真實需求的「個體級」視覺助理:不只知道「哪裡有杯」,更能告訴你「哪裡是你的那隻杯」。透過在地化介面、私隱友善的邊緣運算與跨專業部署,此法有望成為新一代助盲與包容科技的關鍵基石。




3. 阿曼 BankDhofar 銀行推出首款點字簽帳金融卡

2025年10月23日,阿曼 BankDhofar 宣布於全國各分行推出阿曼首張「點字借記卡」(Braille Debit Card)。此舉旨在讓視障顧客在開戶、消費與自助服務等環節獲得與一般用戶同等的金融體驗,進一步落實「以人為本」與「無障礙」的服務承諾。對於關注金融無障礙的香港讀者而言,這是一個具參考價值的國際案例。

重點亮點
觸覺可讀資訊:卡面設計讓視障用戶可透過觸感讀取關鍵資料,包括卡號、CVV 及到期日,減少依賴第三方協助,保護私隱與尊嚴。
操作更易:觸覺標記有助辨識卡片方向與正確插入 ATM/POS,降低操作錯誤並縮短交易時間。
安全與私隱:由於減少口述或外求協助,能降低敏感資料外洩風險,提升交易安全感。
全國可申請:顧客可於就近分行提出申請,職員會指導流程;領卡後可即場啟用,確保上手順暢。

配套與員工培訓
分行與前線人員已於推出前完成專項培訓,內容涵蓋申請指引、啟用支援與視障友善服務禮儀。
分行與 ATM 網絡同時升級:設置更易達的出入口、調整櫃位高度、增設點字鍵盤與語音提示等輔具。
數碼平台優化:提供多語介面與更易用的操作流程,兼顧數碼素養較低的顧客。
整體包容:銀行亦強調性別敏感與私隱友善設施,體現「全人」與「全場景」的無障礙理念。

卡片本體也能是輔具:除手機讀屏與語音銀行外,實體卡的觸覺設計同樣關鍵,可作為「最後一米」的無障礙解決方案。
服務流程一體化:將點字卡與無障礙 ATM(語音導引、耳機孔、實體按鍵)、App 無障礙(VoiceOver/TalkBack、動態字體、色彩對比)及分行導引(凸字標示、觸覺地圖)聯動,形成端到端體驗。
前線培訓與共創:與視障社群及復康機構共創設計與測試腳本,確保真實場景(如高峰時段取款、海外交易、網上購物)皆可順利使用。
私隱與風險管理:在提供可觸讀資訊的同時,建立清晰的使用守則與風險提示(例如在公共場所遮擋卡面),並提供遺失/盜用的一站式緊急支援。

BankDhofar 的點字借記卡以實體觸覺設計補齊了數碼金融無障礙的缺口,讓視障顧客在「識別—操作—交易—安全」的完整路徑上更獨立、更安心。這不僅是一張卡片的創新,更是一整套無障礙服務思維的參考範本。只要銀行、監管與社福界協同推進,配合標準化與實測驗證,完全有條件把金融無障礙化為日常。



*************************************************************************

乙部
專題特寫

MicrosoftEdge的三大好用智慧功能:沉浸式閱讀程式、大聲朗讀與CopilotVision

在AI重新定義生產力與學習方式的2025年,MicrosoftEdge以強大的人工智慧整合能力,成為比較智能、貼近使用者的瀏覽器。
其中「沉浸式閱讀程式」、「大聲朗讀」與「Copilot/Vision」構成三大核心,讓閱讀、理解和操作更流暢、更無障礙。

沉浸式閱讀程式:專注閱讀的極致體驗
沉浸式閱讀程式(ImmersiveReader)是Edge最特別的閱讀模式。它會自動隱藏網頁中的廣告、工具列與其他干擾元素,只保留主要文字與重要圖片,營造出乾淨的閱讀環境。使用者可按F9開啟或關閉此模式。
進入後,可自由調整文字大小、行距與背景色主題,搭配「行聚焦」功能,只顯示一到五行文字,大幅提升專注力。語法工具則能將單詞拆解為音節並高亮不同詞性,是語言學習與特殊教育的重要輔助工具。另一項貼心設計「圖片字典」會顯示詞彙對應圖片,配合即時翻譯功能,幫助使用者理解外文頁面內容。這些設定對閱讀障礙或低視力使用者尤為友好,也讓一般讀者在長時間閱讀時更加輕鬆。

開啟沉浸式閱讀後,一個工具列出現,包括「大聲朗讀」、「文字偏好設定」和「閱讀喜好設定」等;上述許多功能都需要手動啟用,例如啟用即時翻譯功能可依照以下步驟去做:
1.在「閱讀喜好設定」之上按 Enter 鍵。
2.在「翻譯」的下拉方塊選「中文(繁體)」或其他你要翻譯成的語言。
3.將「翻譯整頁」的核取方塊勾選,它便開始進行翻譯。
4.按 Escape 鍵退出「閱讀喜好設定」。
5.下次再啟用即時翻譯的功能時,它會自動選取你要翻譯成的語言,只要將「翻譯整頁」的核取方塊勾選,後按 Escape 鍵即可。

大聲朗讀:讓網頁說出文字
「大聲朗讀」(ReadAloud)與沉浸式閱讀緊密結合,能將文章內容以自然語音播放出來。不論有否開啟沉浸式閱讀只需按下Ctrl+Shift+U即可啟動,控制列會出現在頁面上方,提供「讀取前一個段落」、「暫停大聲朗讀(Ctrl+Shift+U)」、「語音選項」、「讀取下一個段落」等操作。Edge支援多國語音,包括粵語與普通話,你可隨時打開「語音選項」選取你要的語音,朗讀時會同步醒目標示文字。對視障人士、學生或多工使用者而言,這項功能能有效結合聽覺與閱讀能力。

Copilot:你的全方位AI助手
MicrosoftEdge的Copilot模式帶來前所未有的智慧化瀏覽體驗。使用者只要點擊右上角Copilot圖示,或按下Ctrl+Shift+.(句號)即可開啟或關閉 Copilot側邊欄。開啟後請先進入 Copilot 的隱私設定,將「Context clues」和「Video transcript」兩個選項都開啟,然後按 Escape 鍵返回主頁面。
之後只要在多行文字編輯框寫上命令按 Enter 鍵,等待一會後就出現回應結果,而且 NVDA 會自動讀出來,
假如你正在用 Edge 瀏覽一個網頁,你可輸入「顯示網頁主要內容」後按 Enter 鍵試試看。
假如你正在用 Edge 觀看 Youtube 的影片,你可以輸入「顯示影片內容摘要」後按 Enter 鍵試試看。
還可以查詢、概述文章、生成筆記、比價或重寫文字等。再次按下相同快捷鍵即可將側邊欄關閉。
Copilot能跨分頁分析內容、回答問題,甚至幫助篩選或建議最佳選項,例如在多個飯店網頁間比較價格或設施時,AI會自動整理重点。透過語音指令也能與Copilot進行對話式操作,讓瀏覽更自然流暢。

結語
沉浸式閱讀程式、大聲朗讀與Copilot/Vision讓MicrosoftEdge不僅是一個瀏覽器,更是結合閱讀、語音與人工智慧的全方位助理。沉浸式閱讀讓專注變得更容易,大聲朗讀讓文字化為聲音,而Copilot與Vision則以AI思維理解內容、提供語境回應。對任何希望提升效率或重視無障礙體驗的使用者而言,這些功能不只是便利,而是一場瀏覽方式的革命。




可按此前往第二部份的內容


 

< 返回上頁