通訊刊物
第211期 第一部份 (2025年4月版)
香港失明人協進會
無障礙數碼科技通訊 第二百一十一期
Accessible Digital Technology Newsletter (AD Tech) Issue no.211
2025年4月
*************************************************************************
本會提供多項專為視障人士而設立的資訊科技服務,歡迎大家使用︰
聲聞通:以電話語音報讀方式,提供本港九家報章的即日新聞 (只限本會會員)。
電話號碼: (852)3707 4750
資訊科技諮詢電話—透過電話直接解答在電腦應用上遇到疑難的查詢。
電話號碼: (852)2709 5559
網頁無障礙設計主題網站: 提供無障礙網頁設計的指引,技巧和常遇問題等,供業界及市民參考。
https://gate.hkbu.org.hk/service/web
NVDA讀屏軟件下載及教學筆記
https://www.hkbu.org.hk/tc/service/technology/sub-page?page_id=nvda_modules_2021_08
*************************************************************************
如果你還沒有訂閱這份通訊,但希望定期收到這份通訊,可電郵至
enewsletter@hkbu.org.hk
,於主題一欄輸入"訂閱通訊”,同時請留下你的姓名及聯絡電話。如果你是香港以外的朋友,請提供你所在之國家/地區,省份,城市等資料。 有關個人的資料僅用於編輯部和讀者間連系和本通訊發展之參考,本刊物將確保遵守香港《私隱條例》,資料將嚴格保密,不會用於其他用途,也不會在未經你的同意下提供給第三者。通訊將會在每月之最後星期以電郵寄到訂戶之電郵信箱。另外,如你不再希望收到這份通訊,亦可電郵至香港失明人協進會
enewsletter@hkbu.org.hk
,在主題一欄輸入"取消訂閱”或"unsubscribe”便可,記得也要提供你的姓名,閣下亦可於上述網址進行取消訂閱的手續。
*************************************************************************
科技日新月異,對於視障輔助的科技亦有不少創新突破,如AI導航眼鏡,AI文件閱讀裝置等。本期亦會在遊戲無障礙設計及手機無障礙功能有相關報導。此外,今期通訊還會報導Apple在關稅政策下的最新情況,以及Google,Microsoft等科技公司的最新消息。讀者請勿錯過。
本期內容
甲部
視障輔助技術發展
1. 「AI導航眼鏡」登場!上海交通大學科研團隊助視障人士自由行街——語音+觸覺 雙重提示更貼心
2. 育碧開源色盲模擬工具 Chroma 推動遊戲無障礙設計
3. 小米澎湃 OS 2 Beta 版無障礙功能升級 全面修復細節問題
4. Patriot Voice AI:結合 OCR 及 AI 功能的智能閱讀夥伴
乙部
專題特寫 Perplexity Spaces 使用指南
丙部
數碼科技剪報
1. 特朗普親口承認為Apple減免關稅TimCook私下斡旋奏效
2. 美國航空明年起提供免費機上 Wi-Fi,還有哪些航空公司有呢?
3. Google 搜尋將全球統一使用 Google.com,不再區分尾巴的國碼
4. Google 推出有「思考預算」的 Gemini 2.5 Flash 模型
5. 香港本地初創推「免爭拗」網約的士服務乘客可選擇至愛司機+365日真人客服
6. Microsoft推出CopilotVision免費功能Edge用戶可即時共享畫面獲AI協助
丁部
數碼世界消息
1. ChatGPT整合了GPT-4O,能夠進行更逼真和詳細的圖像生成
2. Firefox 137發佈
3. Gmail升級搜索功能可幫助您更快地找到所需的電子郵件
4. Instagram 即將發佈影片編輯工具 Edits
5. Thunderbird 團隊宣佈Thunderbird Pro 和 Thundermail 計劃
6. Windows 10版OneNote即將不再受到Microsoft的支援
7. 世界上最小的起搏器可注射且由光提供動力
*************************************************************************
甲部
視障輔助技術發展
1. 「AI導航眼鏡」登場!上海交通大學科研團隊助視障人士自由行街——語音+觸覺 雙重提示更貼心
你有冇諗過,未來視障朋友行街唔使再怕迷路或撞到障礙物?4 月 16 日消息,上海交通大學科研團隊成功研發一款專為視障人士而設的「AI導航眼鏡」,仲登上國際權威期刊《Nature Machine Intelligence》,成為本週焦點!
全新設計:聲音+震動雙重導航
呢副「AI眼鏡」結合先進人工智能技術,能夠即時解讀眼鏡鏡頭拍攝到嘅周圍環境。當佩戴者接近障礙物或者有物件阻路時,系統會透過骨傳導耳機發出語音提示,話你知左右邊有咩障礙,點行最安全。同時,用家手腕位置仲會貼上可拉伸嘅「人造皮膚」感應貼,遇到危險就會震動提示,俾多一個感覺,令導航更直觀。
軟硬兼備 提升用家體驗
團隊唔止靠AI影像分析咁簡單,更針對真實應用場景同人類習慣,度身訂做專屬算法,令導航反應更貼地。硬件方面,開發出可以伸縮嘅智能人造皮膚,大大提升佩戴舒適感,而且唔會妨礙日常活動。仲有,鞋墊都係智能設計,可以自發電,仲支援虛擬化身訓練,等用家喺模擬環境都可以學習點樣用新科技。
三重感官 導航更安全
此系統將視覺、聽覺同觸覺三種感官結合,令用家無論係行街、過馬路,甚至穿越雜亂房間都可以更安全、更容易。實驗證明,唔只係虛擬世界,喺現實環境中,視障人士都可以用系統順利避開障礙物。
實測結果:室內迷宮、街頭都得!
研究團隊特別邀請咗20位全盲或部分視障嘅朋友實測。結果顯示,有12位參加者能夠順利喺室內迷宮避開障礙物,8位更可以自如行走城市街道,甚至穿越擺滿傢俬嘅會議室,效果顯著。
展望未來:助視障人士提升生活質素
團隊表示,呢項創新科技為視障人士提供更簡單易用嘅導航方案,真正做到以人為本,希望未來有機會引入香港,造福本地有需要嘅社群。
論文詳情:
https://www.nature.com/articles/s42256-025-01018-6
2. 育碧開源色盲模擬工具 Chroma 推動遊戲無障礙設計
育碧於4月15日宣佈,正式開源其內部開發的色盲輔助工具 Chroma,現已可於GitHub下載。Chroma被定位為「一站式檢測遊戲中色盲相關問題的解決方案」,專為遊戲開發者及測試人員而設。
這套工具可於遊戲畫面上即時套用多種色盲濾鏡,涵蓋Protanopia、Deuteranopia及Tritanopia等常見色盲類型,協助用戶在實際遊玩時識別潛在的無障礙問題。Chroma採用Color Oracle算法,支援單屏及雙屏環境,亦設有熱鍵切換及自訂覆蓋層,方便調整各種設定。育碧表示,工具運行時不會影響遊戲效能。
值得一提的是,Chroma僅用作模擬色盲玩家的實際觀感,並不會自動修正遊戲設計上的問題,開發團隊需根據檢測結果作進一步優化。
開源頁面:
https://github.com/ubisoft/UbiChroma
3. 小米澎湃 OS 2 Beta 版無障礙功能升級 全面修復細節問題
4月17日,小米員工 @小楊Yhy 於小米社區發佈了《小米澎湃 OS 2 Beta 版無障礙完整修復日誌》,詳細列出今個 Beta 版本針對無障礙體驗的多項修正與優化內容,包括公共控件、短信、電話、TalkBack、桌面等多個系統層面。此舉有助視障及聽障用戶獲得更佳的裝置體驗,也反映小米對無障礙設計的持續重視。
公共控件優化
本次更新針對多項日常操作的公共控件進行修復。修正內容包括:密碼輸入框無法被選中、索引條無法操作、首次進入頁面時因氣泡彈窗導致焦點卡死等情況。針對開關控件,已解決焦點冗餘及被誤讀為複選框的問題,同時優化了列表內跳轉按鈕及返回按鈕的標籤設置。單選、搜索編輯框等也有針對性調整,確保朗讀內容正確,並加強了對進度條、編輯模式按鈕等細節的無障礙標籤處理。此外,焦點順序、控件類型朗讀、段落分段等多個細節亦有改善。
短信無障礙修正
短信模組方面,更新修正了如衛星地圖短信未加標籤、多選狀態誤報提示、長按菜單選項無法選中等問題。針對北斗衛星短信頁面的空焦點及無意義朗讀,已作出剔除。同時,針對新建短信時的焦點規劃及多選狀態下的多餘焦點,亦進行了優化。
電話及聯絡人模組
電話應用方面,重點修正了來電號碼、撥號盤及通話記錄等焦點和標籤問題,包括透底觸控、通話時長不斷重複播報等,亦有調整撥號盤底部菜單、重複聯絡人彈窗、聯絡人開關控件等細節的朗讀和操作順序。
控制中心及通知中心
控制中心現已修正焦點穿透、藍牙開關狀態播報錯誤、開關類控件缺乏狀態提示等問題,並完善了調整圖標順序、按鈕類型標籤等無障礙細節。通知中心方面,針對返回按鈕、通知設置標題、焦點順序等進行了修正,確保用戶於設置及操作時能獲得正確的語音提示。
設定、鎖屏及桌面
設定頁面方面,今次修正包括開關控件誤讀、控件狀態未播報、新版本提示未播報、返回按鈕及控件標籤缺失等問題,並調整了焦點順序、聲音均衡器焦點等細節。鎖屏部份則加強了快捷方式的雙擊開啟反應。桌面模組則針對小部件長按、頁碼指示器滑動、桌面圖標焦點播報、文件夾點擊等進行優化,解決了焦點穿透及最近任務界面相關問題。
常用應用修正
計算器方面,已修正數字鍵焦點順序錯誤。日曆應用則改善了班休信息感知、選中狀態提示、特殊日程標籤、節日倒數及視圖模式下的空焦點問題。天氣應用則處理了城市選擇頁面大焦點、首頁不可交互元素誤讀等。筆記應用方面,色盤選取、清空按鈕、思維筆記入口等均已補充標籤,並修復了帳號驗證及廢紙簍的誤讀。錄音機則針對進度條手勢、錄音時TalkBack聲音錄入、按鈕狀態提示及空白焦點等多個細節加以改善。文件管理器則完善了分組標題、刪除按鈕、文件類型標籤、界面空白處焦點等問題。小米視頻及瀏覽器均有針對未加標籤、按鈕無法選中、控件誤讀等細節進行修正。
TalkBack 相關問題
針對TalkBack功能,已修復無法調節音量及觸摸失靈等主要問題,提升視障用戶於系統操作時的穩定性。
本次小米澎湃 OS 2 Beta 版針對無障礙體驗的全面修正,涵蓋系統多個層面和常用應用,體現了對特殊需要用戶的高度重視。隨著這些細緻修復,無障礙用戶在日常操作及資訊獲取方面將有明顯提升。
4. Patriot Voice AI:結合 OCR 及 AI 功能的智能閱讀夥伴
來自美國佛羅里達州 Patriot Vision Industries 的 Patriot Voice AI,是一款專為視障人士設計的文件閱讀裝置,屬於早前 Patriot Voice EZ 的全面升級版本。新一代產品繼續以高速、準確著稱,並引入多項以 AI 驅動的新功能,進一步提升用戶無障礙閱讀體驗。
Patriot Voice AI 透過先進的光學字符識別(OCR)技術,能即時掃描各類紙本文件,並以語音讀出內容。裝置支援全文朗讀、逐句報讀及單字拼音,方便用戶按需要靈活選擇。升級後的 AI 功能更可協助用戶自動摘要重點、提取主要資訊、甚至描述圖像內容。例如,在掃描發票或產品資料時,AI 能自動整理出重點資訊,亦可針對藝術品等圖片作簡單描述。
此外,裝置操作介面簡單易明,支援多語言翻譯、條碼識別及手寫體讀取等多種日常應用,並設有自動掃描及免提功能,方便長時間使用。對於本地視障人士,Patriot Voice AI 提供一個穩定、可靠的閱讀方案,無論於家居、圖書館或辦公室環境,均可大幅提升獨立獲取資訊的能力。
影片連結
https://youtu.be/7XqqIsD5jXI
Patriot Voice AI 官方網站
https://patriotvisionindustries.com/product/patriot-voice-ai/
*************************************************************************
乙部
專題特寫 Perplexity Spaces 使用指南
Perplexity AI 簡介
Perplexity AI 是一個功能強大的人工智能搜尋引擎,透過大型語言模型處理用戶的問題,並從網路上搜尋相關資訊提供答案。它成立於2022年,透過結合聊天機器人的對話風格和傳統搜尋引擎的廣泛資訊覆蓋,為用戶提供準確而有深度的搜尋體驗。Perplexity不僅顯示連結,還會整合網路上的答案並引用來源,讓用戶無需逐一點擊連結就能獲取所需資訊。
Perplexity 免費版與收費版的差異
Perplexity 提供免費版和收費版(Pro)兩種服務選項:
免費版特點
• 無限基本搜尋功能。
• 每天5次 Pro 搜尋體驗。
• 每天3次研究(Research)使用額度。
• 基礎檔案上傳功能(每天10個檔案附件)。
• 每個空間(Space)最多上傳5個檔案。
• 使用標準 AI 模型。
Pro 版特點
月費為港幣148元,年費為港幣1,488元,算起來年費似乎便宜一點。
• 無限制使用 Pro 搜尋功能。
• 每天300+次高級搜尋。
• 使用進階 AI 模型(如 GPT-4 Omni、Claude 3 等)。
• 無限制檔案上傳和分析。
• 每個空間最多上傳100個檔案。
• 每月獲得約39港幣(5美元)的 API 使用額度。
• 專屬支援渠道(Discord、Intercom)。
設定繁體中文界面
1. 打開瀏覽器,輸入網址 perplexity.ai 並按下 Enter 鍵。
2. 進入網站後,按 Esc 鍵再按 c 移到 Language 的下拉選單。
3. 按 Alt+向下鍵打開語言選單。
4. 按 向下鍵多次選繁體中文,後案 Enter 鍵。
註冊 Perplexity 帳戶
1. 在 Perplexity 主頁面,可選擇使用 Google 帳戶、Apple ID 或其他電子郵件地址註冊。
2. 選擇相應的選項後按 Enter 鍵。
3. 若選擇使用電子郵件,輸入你的電子郵件地址後按 Tab 鍵,在「使用電子郵件繼續」之上按 Enter 鍵。
4. 接著按照提示完成其他步驟。
5. 接下來需要順序在三個按鈕「開始使用Perplexity」、「繼續使用免費」、「繼續」之上按 Enter 鍵。
Perplexity 基本使用方法
1. 在主頁面的搜尋框中輸入你的問題或關鍵詞。
2. 按 Enter 鍵提交問題。
3. Perplexity 會搜尋網路並提供詳細答案,附上資料來源,所以你需要等待大概一分鐘的時間。,然後看看答案。
4. 你可以在同一對話中繼續提問,按 e 鍵移到輸入框,再按 Enter 鍵,輸入新問題後按 Enter 鍵。
5. 要更改搜尋模式,按 Tab 鍵移到「Focus」按鈕,按 Enter 鍵打開選單,選擇不同搜尋類型::
o Web:一般網頁搜尋
o Academic:學術論文搜尋
o Math:數學計算(使用 Wolfram Alpha)
o YouTube:影片內容搜尋
o Reddit:社群討論搜尋
o Writing:創意寫作輔助
Perplexity Spaces 功能介紹
Perplexity Spaces 是一個組織研究和知識的功能,讓用戶可以:
• 按主題或項目整理對話和檔案
• 與他人共同協作研究
• 上傳檔案作為參考資料
• 為每個空間設定自訂 AI 指令
• 選擇特定的 AI 模型(Pro 版專屬)
免費版與付費版 Spaces 差異
• 免費版:每個空間最多上傳5個檔案
• Pro 版:每個空間最多上傳100個檔案,可選擇進階 AI 模型
建立語音逐字稿聽寫和翻譯空間
以下是建立語音聽寫成逐字稿和翻譯的空間步驟:
1. 登入 Perplexity 帳戶後,按 Escape 然後按 Ctrl+Home 到網頁開頭位置。
2. 按 向下鍵移到左側選單中的「空間」連結,按 Enter 鍵。
3. 按 f 鍵移到「建立空間」按鈕,按 Enter 鍵。
4. 在標題欄位輸入「逐字稿聽寫和翻譯」。
5. 按 Tab 鍵移動到描述欄位,輸入空間的用途描述,可選填。
6. 按 Tab 鍵移到「自定義指令」欄位,複製然後貼上以下指令:
請將以下音訊或影片內容完整聽寫為逐字稿,無需加入時間標記。若語音有明顯不同,請標註說話者;若無明顯不同則可省略。根據語意適當分段,並於每個主題或段落加上合適的 Markdown 標題層級(#、##、###)。完成後,請將逐字稿翻譯成繁體中文,並以相同的分段與標題格式顯示。請先顯示原文逐字稿,再顯示翻譯後的繁體中文內容。全程以純文字格式輸出,內容需條理分明,方便閱讀與整理。
7. 若為 Pro 會員,選擇「Web」(使用網路搜尋)可關閉這個選項,日後或可加快語音處理速度。
8. 按 Tab 鍵移到「繼續」按鈕,按 Enter 鍵確認。
使用逐字稿空間處理 YouTube 影片
1. 建立空間後,系統焦點已經停在輸入框。
2. 在輸入框中貼上 YouTube 影片的網址。
3. 按 Enter 鍵提交請求。
4. Perplexity 將處理該影片內容,首先顯示原文逐字稿,然後提供繁體中文翻譯版本,而且包含了標題層級的顯示方式,所以你需要等待大概一分鐘的時間。
5. 可以使用螢幕閱讀器的網頁瀏覽功能讀出內容,屆時如果覺得效果不夠理想,可再試一次。
6. 若要處理新影片,重複第3-6步操作。
7. 日後若要使用這個聽寫和翻譯功能,可在 Perplexity 的主頁點選「空間」的連結,之後再點選「逐字稿聽寫和翻譯」的連結,再貼上有語音內容的 YouTube 影片網址。
透過這種方式,你可以高效地將 YouTube 影音內容轉換為文字形式,並獲得繁體中文翻譯,而且能聽寫包括英語、日語、西班牙語和其他多種外國語言,可惜中文國語或粵語目前未能聽寫,不過都可支援有 CC 字幕的中文影片。
如果你覺得翻譯出來的效果不夠理想,又或需要翻譯成其他語言,你可以將未有翻譯的逐字原稿複製下來,放到其他智能翻譯服務進行翻譯。
結語
Perplexity Spaces 提供了一個組織知識、處理資訊的強大平台,特別適合需要將多媒體內容轉換為文字的視障人士。透過建立專門的空間和自定義指令,你可以充分利用 AI 的強大功能,將影音資訊轉化為易於訪問的文字格式。無論是學習、工作還是休閒,Perplexity 都能成為你獲取知識的得力助手。
可按此前往第二部份的內容