- Human Simulations of Language Learning
- Machine Learning of Language from Distributional Evidence
- The Computational Nature of Language Learning
- Explorations in Language Learnability Using Probabilistic Grammars and Child-directed Speech
- The Biology of the Language Faculty: Its Perfection, Past and Future (by Noam Chomsky)
- Statistical Natural Language Parsing: Reliable Models of Language?
2007-12-29
[Linguistics] MIT演講:語言學習與電腦模擬
2007-12-12
[Phonetics] Praat腳本:語調標記與繪圖
為了要幫葉老師的書畫一些語調圖,所以寫了一個Praat腳本來處理這些dirty work。這也是真正第一個自己寫的Praat腳本,值得慶賀一下(終於學會了 ^^y )。
腳本的功能說明:
- 標記語調
- 提取音高,手動修正野點(wild point),平滑
- 畫音波圖和語調曲拱
- 存檔(附檔名TextGrid、Pitch、wmf)
流程圖示
######################################
# Annotate and draw intonation
#
# Author: Zhunbang Pbice Liao
# Praat Version: 4.6.34
# Last Update: 2007.10.23
######################################
form File Directory
comment Input file directory
sentence directory c:\praat\
endform
# Create a string file that lists file names.
Create Strings as file list... list 'directory$'*.wav
numberOfFiles = Get number of strings
# if !numberOfFiles
# Create Strings as file list... list'directory$'*.WAV
# numberOfFiles = Get number of strings
# endif
# Loop to read in files
for ifile to numberOfFiles
select Strings list
fileName$ = Get string... ifile
Read from file... 'directory$''fileName$'
name$ = fileName$ -".wav" -".WAV"
# Skip labeling if TextGrid files already exist
if fileReadable (directory$+name$+".TextGrid")
Read from file... 'directory$''name$'.TextGrid
else
# Do labeling
select Sound 'name$'
To TextGrid... Romanization
plus Sound 'name$'
Edit
pause Annotate the sound then click "continue"
endeditor
endif
# Skip extract pitch contour if Pitch file exit
if fileReadable (directory$+name$+".Pitch")
Read from file... 'directory$''name$'.Pitch
else
# Extract pitch contour
select Sound 'name$'
To Pitch... 0 50 300
select Pitch 'name$'
Edit
select Sound 'name$'
plus TextGrid 'name$'
# Edit
pause Fix pitch points then click "continue"
endeditor
endeditor
select Pitch 'name$'
Smooth... 5
endif
# Draw waveform
Erase all
Black
14
Helvetica
select Sound 'name$'
Select outer viewport... 0 7.5 0 1.5
Line width... 1
Draw... 0 0 0 0 no Curve
# Draw intonation contour
select Pitch 'name$'
plus TextGrid 'name$'
Line width... 3
Select outer viewport... 0 7.5 0.5 5.5
Draw separately... 0 0 0 300 yes yes yes
Line width... 3
Draw separately... 0 0 0 300 no no no
Line width... 3.5
Select outer viewport... 0 7.5 0 5.5
Axes... 0 7.5 0 5.5
Draw rectangle... 0 7.5 0 5.5
# Save File
Write to Windows metafile... 'directory$''name$'.wmf
if not fileReadable (directory$+name$+".TextGrid")
select TextGrid 'name$'
Write to text file... 'directory$''name$'.TextGrid
endif
if not fileReadable (directory$+name$+".Pitch")
select Pitch 'name$'
Write to text file... 'directory$''name$'.Pitch
endif
# Remove
select Sound 'name$'
plus TextGrid 'name$'
plus Pitch 'name$'
Remove
select Pitch 'name$'
Remove
endfor
select all
Remove
# End of script
[Phonetics] Praat 5.0 發佈
- 支援Unicode:5.0最大的改進就是全面支援Unicode了!早期Praat只支援ASCII,從4.6版開始,陸續支援Unicode。現在script、string、table、OT learning、檔案名稱......等都可以使用Uincode了。雖然目前中文字在TextGrid視窗還無法正常顯示,但存成文字檔不成問題(UTF-16編碼)。作者承諾未來在5.1版全面支援中文。
- 加大Pitcure視窗:雖然預設值一樣都是4x6英吋,但新版的Pitcure視窗比較大,感覺像是放大比例,或是拉近距離。
- 在Sound和TextGrid視窗,新增Draw指令(在File命令之下)。可以直接在Picture視窗畫出選取區域的圖形。
- 改善羅吉斯回歸(logistic regression)
- 改善優選論(optimality theory)學習
- 改善複製圖片到剪貼簿
- 可讀取FLAC檔案
【延伸閱讀】
2007-03-01
[Miscellaneous] 學術研究、語言學與RSS
底下列出一些我常去的語言學相關網站,不提供RSS的就不列入了。順便一提,RSS雖然能夠帶來最新的資訊,但訊息量太大(因為自己會很貪心地訂閱了N個RSS)。不過RSS不是email,所以不必每一篇都讀。我的方法是只瀏覽標題,有興趣的才讀內容,就好像讀報紙一樣。被海量資訊淹沒的現代人已經很焦慮了,不應該再給自己更多的負擔。(不過,這篇文章就是用來增加讀者的負擔的.... XD)
語言學期刊
Ⅰ. 語言學類(語音學)
- Applied Linguistics
- Applied Psycholinguistics
- Journal of the International Phonetic Association
- Journal of Psycholinguistic Research
- Language and Speech
- Phonetica
Ⅲ. 中文期刊:
不過,有一些期刊目前還沒有RSS,例如語言學的Journal of the Acoustical Society of America、中國語文;語言教學的華語文教學研究;電腦輔助語言教學的Language Learning & Technology、CALICO Journal等。沒有RSS的Journal of Phonetics可以透過ScienceDirect Alert訂閱電子報。至於其他的期刊嘛~還是得要查資料庫了。
語言學mailing list
- Linguist List:全世界最大的語言學mailing list,有書籍出版、博士論文摘要、期刊目錄、研討會徵稿、工作機會等資訊。語言學家也會在上面發表自己對文獻的評論、發問問題、尋求協助等等,是語言學家每日必看的電子報,現在也提供RSS。
語言學討論群組、論壇
- sci.lang:是Usenet上最大的語言學討論群組,可以訂閱Google Groups提供的RSS。
語言學新聞
- LingNews:語言學、第二語言教學的相關新聞網站,以Digg的方式呈現。
- Science Daily » Language Acquisition:每日科學是介紹新近科學研究成果的網站,其中有一小類是關於語言習得。
- 台灣英語網 » 英語相關新聞:該網站蒐集、轉貼新聞媒體的英語相關新聞,是瞭解台灣英語教學新聞的好途徑。(不過很可惜,只轉貼台灣媒體的新聞,內容常重複而缺乏新意)
研討會訊息
- Conference Alert:我的研討會訊息主要來自Linguist List和台灣語言學討論區電子報。Conference Alert這個網站則提供email通知,舉辦地區的部分提供RSS(為什麼分類主題不提供?)這個網站涵蓋的範圍較廣,因此並未羅列每一個研討會。
- 台灣語言學討論區電子報:台灣語言學會的mailing list,不提供網頁形式。有台灣語言學會、中文計算語言學會、華語文教學學會、英語教學學會等單位的訊息、研討會徵稿等,是台灣地區語言學家的討論平台。
語言學部落格
- Language Log:由 Mark Liberman 和 Geoffrey Pullum 兩位主筆,也邀請其他學者一起撰寫,主要討論日常生活、媒體報導中的語言議題,是部落圈中最知名的語言學部落格。他們更新很頻繁,每日張貼3~5篇文章,而這些文章還曾集結成冊出版。
- Language Hat:作者說他會13種語言(當然,能力有高有低)。我瞄了一下Archive,最早的一篇是2002年7月,算是資深部落格了。
- Language and Humor Blog:作者Kevin Sullivan也是個熱愛語言的人,學過美國手語、西班牙文、德文、法文、日文、中文,讀的是TOSEL專業。顧名思義,該部落格以輕鬆幽默為主。
- John Wells’s phonetic blog:John Wells是國際語音學會會長、University College London教授。他開始撰寫部落格的時候,我曾寫信建議他應該要有RSS,現在果然有了。他的部落格常常使用IPA,因此需要先安裝IPA字型;如果還是看不到,建議用Firefox或Opera。
- Phonoloblog:音韻學為主,是團體部落格,他們也歡迎對音韻學有興趣的人加入。
中文相關的網站
- Chinese Forum:英文論壇,討論中文的聽說讀寫、輸入法、中國文化、音樂、飲食、社會等等。
- Pinyin News:Mark Swofford主持的網站,有非常詳盡的各種拼音介紹,包括:國語羅馬字、漢語拼音、通用拼音、注音符號、注音符號第二式、威妥瑪、耶魯式等。他的部落格也常有華文圈關於拼音的新聞,推薦閱讀。
- 北大中文論壇:北京大學中文系的學術論壇,以中文為主,範圍涵蓋方言、語音、對外漢語、中文信息處理等,該論壇有不少大學教授參與。
【延伸閱讀】
- Pbice » SCI、SSCI、A&HCI 語言學期刊的清單
- CNET電腦區/楊士範 » RSS--訂作專屬的新聞網站
2007-02-27
[Phonetics] 下載 MIT 的博士論文
- Selkirk, Elisabeth O'Brian (1972) The phrase phonology of English and French
- Pierrehumbert, Janet Breckenridge (1980) The phonology and phonetics of English intonation
- Yip, Moira Jean (1980) The tonal phonology of Chinese
- Bao, Zhiming (1990) On the nature of tone
- Duanmu, San (1990) A formal study of syllable, tone, stress and domain in Chinese languages
(提示:穀歌大神)
2007-02-19
[TCSL] 華語語音數位教材的錯誤
一、華語拼音創意教學
華語拼音創意教學是僑委會線上學習網的課程,主講者是朱阿莉老師。課程將「舌尖後音」誤為「舌間後音」。我猜是因為朱老師以口頭表達,而文化大學推廣部在後期製作的時候把字打錯了。語音學中只有齒間音(interdental),而舌尖後音指的是捲舌音(retroflex),並沒有「舌間後音」。
二、My Mandarin
這是MyMandarin.com線上課程的一部份。這個拼音教學同時標注漢語拼音和注音符號,但卻誤把ㄙ/s/標成ㄥ/ing/了。雖然僅有一筆之差,但一個是聲母、一個是韻母,兩者完全不同。
三、Pinyin Practice
Pinyin Practice是專門練習漢語拼音的網站(也有軟體)。底下這張圖是舊版的首頁,不過現在已經看不到了。
至於為什麼我仍舊把它列出來呢?因為該網站的示範語音有一個錯誤。我把原本Flash中的聲音擷取出來,讓大家聽聽看:
發現問題了嗎?為了證明我所言非虛,我用Praat提取音高,再到Excel裡畫成五度。果然!第一聲不夠高,其調值只有33,而非標準的55。(虛線表示五度)
我想這不是因為發音人的口音不夠標準所致,而是錄音時不小心造成的。不過與一聲的標準相差已達2度,人耳可明顯察覺差異,這種變異顯然是不良的示範。
四、Instant Speak Chinese
Instant Speak Chinese在網站放了如何使用該網站教材的示範錄影,但製作示範語音的時候,沒有考慮獨立音節和連續語流的差異。第一句中,「先生,早上好」的「生」在句子中是輕聲,但單字語音的時候是一聲(此外,這一句發音人的捲舌也不夠標準)。而第二句「小姐,早上好」的「姐」在句子是三聲,但單字卻是一聲(而圖中的拼音則標示輕聲)。因為教材有誤,所以在這個錄影中的外國學生也就跟著犯錯,把「小姐」唸成「小街」,顯然教材已經誤導了學生。
五、BBC Real Chinese
這是英國國家廣播公司所製作的中文教學。在聲調符號的部分有個小錯誤。該網站用的三聲符號是朝上的小圓帽,但實際上,漢語拼音用的是折線。
我把它們放大一點,看出差異了嗎?
ă ǎ
左邊符號在Unicode中的編碼是0103,而右邊符號的編碼是01CE,兩個字母是不一樣的。
六、小結
中文熱雖然帶來華語教學的榮景,但大量的教材卻未經嚴格把關,錯漏難免。因此我們急需教材的審核、評鑑機制。光是編撰教材是遠遠不夠的,教材還應該仔細檢查正確與否,以免把錯誤的知識灌輸給老師和學生,屆時就需要數倍的時間去改正了。
【更新】
感謝Fish來信告知,第一段更正一處錯誤、及兩個錯字。 --2007.02.22
2007-02-01
[Phonetics] 台灣國語語音的專書、論文
這裡先蒐集了一些書目,只列專書和博碩士論文。報紙、期刊文章和書本章節改日再整理。
〔國語運動歷史〕
- Liu, F. (1925). Les mouvements de la langue nationale en Chine (Société d'Edition ed.). Paris: Les Belles Lettres.
- Tai, J. H. Y. (1978). Phonological changes in modern standard Chinese in the People's Republic of China since 1949 (Report). Washington, D.C.: Office of Research, United States Information Agency.
- 方師鐸(1965)。五十年來中國國語運動史。台北:國語日報。
- 方師鐸(1975)。中華新韻「庚」「東」兩韻中「ㄨㄥ」「—ㄨㄥ」兩韻母的糾葛。臺北:國語日報社。
- 方祖燊(1996)。方祖燊全集(第六卷:國語運動史)。臺北:文史哲。
- 王炬(1951)。國語運動的理論與實際。台北:台灣省國語推行委員會。
- 史穎君(1985)。我國國語運動之研究(一九一二~一九八一年)。國立政治大學教育研究所碩士論文。
- 何容、齊鐵恨、王炬(編)(1948)。台灣之國語運動。台北:台灣書店。
- 志村雅久(1993)。中華民國台灣地區推行國語運動之研究。國立台灣大學三民主義研究所碩士論文。
- 卓文義(1972)。民國初期的國語運動。文化大學史學研究所碩士論文。
- 柳明奎(1961)。中國國語運動發展史。臺灣省立師範大學碩士論文。
- 夏金英(1994)。臺灣光復後之國語運動(1945-1987)。國立台灣師範大學歷史學系碩士論文。
- 張博宇(1974)。臺灣地區國語運動史料。台北:商務印書館。
- 張博宇(編)(1987)。慶祝臺灣光復四十週年臺灣地區國語推行資料彙編。臺中縣:臺灣省教育廳。
- 詹瑋(1992)。吳稚暉與國語運動。台北:文史哲。
- 黎錦熙(1934)。國語運動史綱。上海:商務印書館。
- 錢玄同(1999)。錢玄同文集(第三卷:漢字改革與國語運動)。北京:中國人民大學。
〔語音〕
- Chu, M.-N. (1998). The tonal system of Taipei Mandarin: Cross-dialect comparison and dialect-internal variation (China, Taiwan). Unpublished master's thesis, The University of Texas at Arlington.
- Kubler, C. C. (1985). The development of Mandarin in Taiwan: A case study of language contact. Taipei: Student Book.
- Kuo, Y.-H. (2005). New dialect formation: The case of Taiwanese Mandarin. Unpublished doctoral dissertation, University of Essex, UK.
- Tai, J. H. Y. (1978). Phonological changes in modern standard Chinese in the People's Republic of China since 1949 (Report). Washington, D.C.: Office of Research, United States Information Agency.
- Torgerson, R. C. (2005). A comparison of Beijing and Taiwan Mandarin tone register: An acoustic analysis of three native speech styles. Unpublished master's thesis, Brigham Young University, Provo, Utah.
- 佐藤圭司(1996)。《普通話》與《台灣國語》的對照研究。東吳大學日本語文學系碩士論文。
- 林怡君(2002)。台灣華語介音歸屬的實驗研究。國立清華大學語言學研究所碩士論文。
- 張之玲(2000)。台灣華語介音的歸屬。國立清華大學語言學研究所碩士論文。
- 許書瑜(2006)。台灣地區國語二聲的聲調變異之語音學研究:閩南語/國語雙語語者和國語單語語者之比較。國立政治大學語言研究所博士論文。
- 許慧如(2005)。台灣華語的幾個等化現象。國立臺灣師範大學英語學系博士論文。
- 陳春美(2001)。2000年台灣總統大選三位候選人語音的聲學與感知聽辨分析。國立台灣師範大學華語文教學研究所碩士論文。
- 馮怡蓁(1996)。台灣地區國語四聲的聲學特質。國立臺灣大學語言學研究所碩士論文。
- 熊慎敬(2002)。台灣華語語句焦點之聲學表現。國立新竹師範學院台灣語言與語文教育研究所碩士論文。
- 樂麗琪(1991)。國語軟顎鼻音在台灣的音變狀況。輔仁大學語言學研究所碩士論文。
- 鄭良偉(1997)。台、華語的接觸與同義語的互動。台北:遠流。
- 鄭齊兒(2004)。從聲學語音學角度分析在台灣的國語中聲調之連併。國立政治大學語言研究所碩士論文。
- 蕭菁惠(2006)。臺灣地區華語語音調查研究--以閩南語區、客語區高中生個案為例。國立台灣師範大學華語文教學研究所碩士論文。
- 戴凱峰(1996)。從語言學的觀點探討臺灣與北京國語間之差異。政治作戰學校外國語文學系碩士論文。
- 簡清國(1971)。臺語國語音韻系統對比研究。輔仁大學語言學研究所碩士論文。
- 魏岫明(1984)。國語演變之研究。台北:國立台灣大學文學院。
- 羅勤正(2003)。上升調的下降:閩南人說國語時的二聲變調。國立高雄師範大學英語學系碩士論文。
〔社會語言〕
- Brubaker, B. L. (2003). Language Attitudes and Identity in Taiwan. Unpublished master's thesis, University of Pittsburgh.
- Chan, H.-C. (1994). Language shift in Taiwan: Social and political determinants. Unpublished doctoral dissertation, Georgetown University, Washington, D.C.
- Feifel, K.-E. (1994). Language attitude in Taiwan: A social evaluation of language in social change. Taipei: Crane.
- Yang, R. Y.-S. (1988). Language maintenance and language shift among the Chinese on Taiwan. Taipei: Crane.
- 任承英(2000)。語言腔調感知及其主觀評價之研究。國立新竹師範學院臺灣語言與語文教育研究所碩士論文。
- 吳淑娟(2002)。台灣南投縣埔里鎮國語第四聲社會語言變異之研究。靜宜大學外國語文學系碩士論文。
- 呂麗蓉(1987)。台灣地區語言使用及族類認同之調查研究。輔仁大學語言學研究所碩士論文。
- 李明潔(1994)。國語捲舌聲母「ㄓ」,「ㄔ」,「ㄕ」之社會變異研究。靜宜大學外國語文學系碩士論文。
- 林憶秋(1987)。大臺北地區民眾對國語與臺語及其使用之態度調查。國立臺灣師範大學英語研究所碩士論文。
- 曹逢甫(1997)。族群語言政策:海峽兩岸的比較。台北:文鶴。
- 傅若瑋(1998)。中文聲調變異與社會網路:臺中縣潭子國中個案研究。靜宜大學英國語文學系碩士論文。
- 曾國盛(2004)。北埔地區客家人使用國語ㄐ、ㄑ、ㄒ之社會變異研究。靜宜大學英國語文學系碩士論文。
- 黃宣範(1995)。語言、社會與族群意識—台灣社會語言學的研究。台北:文鶴。
- 詹惠珍(1984)。國語/z/在台灣的發展狀況--社會語言學研究。輔仁大學語言學研究所碩士論文。
- 蔡淑儀(1997)。競爭中的語言-以台語和國語為個案研究。輔仁大學語言學研究所碩士論文。
【延伸閱讀】
- 維基百科 » 台灣國語
2007-01-13
[CALL] 語言學習者與母語者在部落格上的互動
2006年10月我到高雄去報告〈Blog於華語教學之應用〉,華教地圖詢問在部落格上如何促進華語學習者和母語者的互動。經過這些時間的空想瞎猜,短時間之內沒有更多的想法,因此暫且紀錄如下:
- 平台:選擇平台主要的就是曝光率,或者說,在網路上的能見度。Web 2.0 主要的是社群(community)的力量,而部落圈更是「格格相連到天邊」。但如果在法國的部落格平台上開設中文部落格,讀者自然比較少。既然是要練習目標語,當然該選該語言的BSP。以華文部落圈來說,大概是有名大站、博客網、中國博客網等。
- 聯播:可以仿照華語教學分享館的方式進行RSS聯播,將相同主題的文章放在一起。另外像ESLblog一樣把學習者的部落格放在同一個平台也是不錯的方法;可以鼓勵學生互相評論。
- 內容:部落格本身是網路書寫的工具,而內容才是吸引人的地方。IT界有一句經典: "Content is king." 那麼,怎麼樣的內容才能吸引母語者的目光?其實,有趣的主題太多了,包括:介紹自己、介紹自己的國家或文化、語言文化上的差異、語言學習經驗......等等。甚至,可以在部落格上問一些問題,而這些文章都能引來不少網友的回應。
- 合作:前三種方法都是被動地等待讀者來參與,其實也可以主動和母語者合作。例如Wu (2005)進行跨國的語言交換合作,可以使兩邊的學生互惠;而Prof. Tseng請修課的學生到部落格給NNS回應,觀察NNS的語言使用情形,進行語言習得研究。諸如此類的合作,都能讓部落格上的討論熱絡許多。
參考書目
- Campbell, A. P. (2003). Weblogs for use with ESL classes. Internet TESL Journal, 9. Retrieved March 12, 2006, from http://iteslj.org/Techniques/Campbell-Weblogs.html.
- Campbell, A. P. (2004). Using LiveJournal for authentic communication in EFL classes. Internet TESL Journal, 10. Retrieved January 12, 2007, from http://iteslj.org/Techniques/Campbell-LiveJournal/.
- Wu, W.-S. (2005). Using blogs in an EFL writing class. Paper presented at the 2005 Conference and Workshop on TEFL and Applied Linguistics, Taoyuan, Taiwan.
2007-01-02
[Book] Endnote & RefWorks 論文與文獻寫作管理
作者: 童國倫、潘奕萍、張鼎祥
出版年:2006
出版社:臺北:五南
【心得】
這是大概是第一本介紹Endnote的中文書吧?得知有這樣的書出版時,相當興奮的去買了一本,不過很快就翻完了。雖然此書有350頁,不過圖片佔大多數,再加上Endnote和RefWorks我都曾經用過,因此期望中「進階功能」的說明反而很少,這本書應該比較適合入門的使用者吧!
兩者比較
RefWorks是Web-based的,而Endnote則在本機上運行。兩者相較自然是互有優劣:RefWorks匯入書目時大多不需要選filter,十分方便(像CSA資料庫是one-click即可匯出);而我在匯入Endnote書目時則常因選錯filter而無法成功。不過在MS Word引用的時候,Endnote可以立即更新書目,所見即所得;但RefWorks卻要等到全部插入後,才能夠看得到完整書目,後者修改也比較不便。
Endnote
Endnote因使用者眾,許多資料庫都支援匯出成Endnote格式,官方網站上也會提供各資料庫的filters,下載更新就好。不過我十分不能理解的是,為什麼Endnote中不採「資料夾」的概念,而是把不同library分成不同的檔案呢?像我自己把不同領域的書目放在不同的library,結果常常需要切換、或是打開多個library,十分不便。Endnote X雖然有個新功能可以將多個libraries輸出成一個 .enlx 的檔案,不過其他書目管理軟體不支援格式轉換,新的格式9.0以前的版本也打不開,所以....再考慮一下吧....
另外,原本從Google Scholar匯出到新版的Endnote X會有問題(方法參考前文)。後來我在EndNote email list archive看到有人向該公司反應,現在總算推出更新檔了。
RefWorks
RefWorks 是我第一個使用的書目管理軟體,不過因為使用的時間比較短,所以沒有太多的心得可報告。其優點除了上述的one-click匯出、有網路即可使用、也可以線上分享書目(不過我似乎沒有看到太多分享的人...)。另外,他們對於在地化做得比較用心,台灣的全國博碩士論文資訊網、中華民國期刊論文索引系統;大陸的中國期刊網都有匯入的說明。其缺點為編制書目較為不便,而Cite & Write使用時會有遲滯的現象。
小結
上回提到APA格式的排序問題,我想研究者實在不該為這類的細節死太多腦細胞,因此還是使用書目管理軟體吧。不過必須注意的是,我對照APA手冊後發現,書目軟體還是有不盡符合之處,因此完稿時還是得仔細校對一遍。另外,中文的APA格式目前仍然沒有大家認可的標準寫法,書目軟體也都不支持,是有待改進之處。
【學習資源】
Endnote
1. 台灣大學圖書館 (影片)2. Endnote官方網站 (影片)
3. 華盛頓大學健康科學圖書館 (圖文)
RefWorks
RefWorks官方網站(影片)