2017年5月13日 星期六

列出文章內所有單字 (MvQdict)

在這邊提供一個工具,可以將任何文章轉成單字清單,並轉換成CLT檔。
這樣未來就可以享受在MvQdict上的字彙管理功能。












按此下載按此下載 2
(2017/6/1)
轉換程式 和 開啟所產出clt檔的MvQdict都屬於永久免費程式。

程式開始會先初始化環境,如果成功的話,程式底下會產生兩個資料夾 (article_to_list_input, article_to_list_output)。
使用者要將文字檔 (想要被轉換的檔案) 放在article_to_list_input。如果成功轉換後,結果會放在article_to_list_output。
可以一次放多個檔案在article_to_list_input內,最後都換轉成相對應檔名的CLT檔。
單檔字彙上限代表,一個檔案最多會有多少字彙。
假設設5000,那原始檔如果有50000個字彙,就會被切成10個檔案。

### 若無法成功轉換,可以按一下 初始化 按鈕,然後再重新按一下 開始轉換 按鈕 ###

保留原檔文字選項 :
如果勾起這個選項,將會花較久的時間才能夠完成。
這個功能在於,當我們把字彙都整理出來後,我們也想知道,在這篇文章裡,有哪些地方出現這些字彙,而此功能就會將這些資訊塞進註解內。匯進MvQdict系統後,就可以在單字上按右鍵得到這些結果。

文字檔必需要符合下面的格式,才會被有效被轉換喔。

  1. 檔案必需要被存成UTF-8,建議直接使用notepad++編輯後儲存。
  2. 然後把你想要處理的文章內的文字,複製起來,貼在article_to_list_input內的文字檔,文字檔可以創自己  喜歡的檔名,而後再按下開始轉換,就可以在article_to_list_output內找到轉換好的需檔案。
  3. 該CLT檔案不能夠直接用一般編輯器開啟,必須要匯進MvQdict內,才能夠閱讀


譬如說 :
以下面這篇文章
http://www.freerepublic.com/focus/f-news/1023979/posts

透過轉換後,會產生這個檔案,用拖拉的方式,將它進拉MvQdict內看結果,
會知道這篇文章內有3138個單字。
畫面如下 :




















如果在使用中有發生問題,可以來信告訴我。
順便在信裡說明,預期的呈現結果。由我來幫你解決問題
信箱 : science.pchsu@gmail.com