查看完整版本 : 網上將簡體繁體化嘅程式點解咁rigid?

Joyidea 2022-3-29 06:56

係網上,咩一王三後,原來係一王三后,個視頻字幕就係簡體字,片主應該係輸入簡體title然後電腦程式自動變成繁體title。但係"后"都係繁體字,點解個程式咁rigid嘅,唔准一啲簡體字其實都係繁體字出現嘅? 好似"云"咁。

倩君沈醉 2022-3-29 13:13

[quote]原帖由 [i]Joyidea[/i] 於 2022-3-29 06:56 發表 [url=https://www.discuss.com.hk/redirect.php?goto=findpost&pid=547045042&ptid=30496112][img]https://www.discuss.com.hk/images/common/back.gif[/img][/url]
係網上,咩一王三後,原來係一王三后,個視頻字幕就係簡體字,片主應該係輸入簡體title然後電腦程式自動變成繁體title。但係"后"都係繁體字,點解個程式咁rigid嘅,唔准一啲簡體字其實都係繁體字出現嘅? 好似"云"咁。 [/quote]
簡體字有很多字合併了,如上述後后不分,同樣例字還有不少:
髮發
面麵
覆複復
鬆松
里裏裡
電腦繁簡轉換時,無法自決,一定會有差別。
更甚者,你可將「卜算子」三字轉由簡轉繁,看成了什麼。
電腦繁

Joyidea 2022-3-29 16:04

[quote]原帖由 [i]倩君沈醉[/i] 於 2022-3-29 13:13 發表 [url=https://www.discuss.com.hk/redirect.php?goto=findpost&pid=547053023&ptid=30496112][img]https://www.discuss.com.hk/images/common/back.gif[/img][/url]

簡體字有很多字合併了,如上述後后不分,同樣例字還有不少:
髮發
面麵
覆複復
鬆松
里裏裡
電腦繁簡轉換時,無法自決,一定會有差別。
更甚者,你可將「卜算子」三字轉由簡轉繁,看成了什麼。
電腦繁 [/quote]
係囉!其實呢啲我覺得好易解決啫,有簡體字如果都係繁體字嘅就睇下前後左右嘅字決定轉唔轉或保留原體,呢啲視乎你做唔做多啲程式架啫。

黃金星期 2022-3-30 04:31

[quote]原帖由 [i]Joyidea[/i] 於 2022-3-29 06:56 發表 [url=https://www.discuss.com.hk/redirect.php?goto=findpost&pid=547045042&ptid=30496112][img]https://www.discuss.com.hk/images/common/back.gif[/img][/url]
係網上,咩一王三後,原來係一王三后,個視頻字幕就係簡體字,片主應該係輸入簡體title然後電腦程式自動變成繁體title。但係"后"都係繁體字,點解個程式咁rigid嘅,唔准一啲簡體字其實都係繁體字出現嘅? 好似"云"咁。 [/quote]
曾經見過,人云亦云,變成了「人雲亦雲」。

在不用轉換的情況下,卻轉換了。

================


如同,香港市民,會寫錯麗字和關字的簡體字。

會把麗字上面的「一橫」,分開成「兩橫」來寫。
又會把「關」字的簡體字外層,加上了一個門字。

香港市民,也會將「蘋果」的簡體「苹」字,

加上3點水,把「 苹 果」寫成 「萍 果」。
================

(1)因為字多和字少。

一個簡體字,可以代表幾個繁體字。

例如「 抑 郁 」, 和 「 郁來郁去」 ,

於是就要系統選擇以及區別出,該個簡體字,

是來於自哪一個繁體字。

否則就會出現「[b]鬱來[/b][b]鬱去[/b]」,如同「人雲亦雲」。




例如: 「公 里」, 的 里 字, 不用變成「公 裏」,
因為「里」已經是繁體。



而「心 里」, 的 里 字, 就要變成「心 裏」,
因為這個情況下,「裏」才是繁體。


(2)製作和設計轉換程式的作者和使用的用戶,是簡體字的用家,

他們或會不知道繁體字是甚麼,於是就會在不知情的情況下,把不用轉換的字,

也一併轉換了,做不出轉換出正確的繁體字的系統出來。

===========

現時香港討論區, 作者和用家, 是繁體使用者,
香港討論區正在進行這個簡轉繁系統, 正在不斷地優化, 有朝一日,
有望成為全球, 最準確的簡轉繁系統。


雖然目前,香討,有些字,例如簡體的于字,仍然會顯示于,未曾完全繁化。


以現時,全球,使用香討 或 Google Translate去把簡轉繁,

應該是比較準確。
======================

(3)不過,最經典,很有趣的,就是:

「海內存知己」, 會轉換成:「海記憶體知己」,


令人懷疑,唐朝時,是否已發明了記憶體?


[attach]13169827[/attach]


[attach]13169802[/attach]


================



(4) 最近,可曾發現,很多繁體中文字幕,

骨字、體字和過字,入面的「7」字形東西,

有時向左,有時向右。

你有如何看法呢?

[attach]13169819[/attach]

============

離題一講:


最近, 在手機輸入 qr code, 會自動變成 we code,
輸入 pdf, 會自動變成 off,  還以為自己打錯字,
重新再輸入, 也是we 和 off , 原來是人工智能,
識得自動轉換了, 真係擾民。

[[i] 本帖最後由 黃金星期 於 2022-3-31 05:22 編輯 [/i]]

paploo 2022-4-1 21:50

有邊一個online 網址可以簡變繁,但冇字數限制?  目前最多好似20000 characters.


大陸簡體最壞地方並不是字型改變,其實只要一字對一字,字型簡化並無不當。 翻譯亦容易。 但由多變一就麻煩。 電腦一對一轉換非常之容易。但一對衆,或衆對一就要一定人工智能才能分辨。  例如風云, 到底是風清揚説話,定風雲呢?  就算人亦會遇到困難。

Joyidea 2022-4-1 22:23

[quote]原帖由 [i]paploo[/i] 於 2022-4-1 21:50 發表 [url=https://www.discuss.com.hk/redirect.php?goto=findpost&pid=547163294&ptid=30496112][img]https://www.discuss.com.hk/images/common/back.gif[/img][/url]
有邊一個online 網址可以簡變繁,但冇字數限制?  目前最多好似20000 characters.


大陸簡體最壞地方並不是字型改變,其實只要一字對一字,字型簡化並無不當。 翻譯亦容易。 但由多變一就麻煩。 電腦一對一轉換非常之容易。但一對衆,或衆對一就要一定人工智能才能分辨。  例如風云, 到底是風清揚説話,定風雲呢?  就算人亦會遇到困難。 [/quote]
你舉個例子可以睇標點符號,不過如果作者唔寫正確標點符號就冇符囉!

paploo 2022-4-1 23:37

[quote]原帖由 [i]Joyidea[/i] 於 2022-4-1 22:23 發表 [url=https://www.discuss.com.hk/redirect.php?goto=findpost&pid=547164077&ptid=30496112][img]https://www.discuss.com.hk/images/common/back.gif[/img][/url]

你舉個例子可以睇標點符號,不過如果作者唔寫正確標點符號就冇符囉! [/quote]
唔少古書本來冇標點符號。
頁: [1]
查看完整版本: 網上將簡體繁體化嘅程式點解咁rigid?