2010-11-06

用Dir指令列出Unicode檔名清單

我原本就知道MS-DOS模式底下的dir指令可以將結果輸出成文字檔,這樣可以很方便的將所有檔案的檔名做成清單。不過,遇到Unicode檔名該如何處理?看了這篇文章〈利用 dir 將檔案總管中的目錄裏的檔名轉成文字檔〉,覺得很實用,摘記如下:

  1. 先新增一個文字檔(例如list.txt),將編碼改成Unicode。
  2. 輸入cmd /u,以Unicode模式執行。
  3. 執行dir指令,dir >> list.txt。如果只想列出檔名、不要日期、路徑等資訊,可以加參數 b
  4. 注意輸出時一定要有2個輸出符號>>,否則會亂碼。

如果需要大量更改檔名,可以配合Ant Renamer使用。

2010-11-02

【讀書心得】Phonetic Symbol Guide

book-phonetic-symbol-guidePullum, G. K., & Ladusaw, W. A. (1996). Phonetic symbol guide (2nd ed.). Chicago: University of Chicago Press.

 

(註:本文使用國際音標字型,如果您無法閱讀,請將網頁編碼調整為unicode、或安裝字型。此外,為了便於區別起見,美式用法以紅色表示,IPA則不標示。 )

 

前言

以前閱讀語音學文獻的時候,遇到美式用法的音標,總是覺得很討厭。因為我比較熟悉的是國際音標(IPA),對於不熟悉的美式用法,讀起來總是有困難。美式用法有許多IPA沒有的符號,比如齦拍音(alveolar flap)的IPA是[ɾ](魚鉤r),但美式卻是[](小型大寫D)。又如齦後清塞擦音(voiceless postalveolar affricate),例如英文church的[tʃ],美式用法卻寫成[č](c戴楔形帽子)。再如IPA的[y]是前高圓唇元音(中文的「迂」),但美式音標則將[y]用來標記硬顎滑音(palatal glide),相當於IPA的[j]。雖然英文中的yoga、year的y都發成[j]沒錯,但不是所有語言的y都發成[j]啊?

(圖1:IPA和美式用法的比較)
ipa-vs-american-phonetic-alphabet

我總覺得:「為什麼大家不用IPA呢?這樣不是比較一致、比較容易閱讀嗎?」。直到最近讀了《語音符號指南 (Phonetic Symbol Guide)》這本書,瞭解了美式用法的來龍去脈,我現在比較不排斥美式用法了。

 

IPA傳統

最早是一群法國和英國的語言教師,想把語音學應用到語言教學中,1886在巴黎創立「語音教師學會」(Dhi Fonètik Tîcerz' Asóciécon),也就是後來的國際語音學會(International Phonetic Association)。當時Otto Jespersen就建議,應該制訂一套所有語言共通的語音字母,於是第一版的國際音標在1888年問世。

闡述語音符號原則的是1949年的經典著作《國際語音學會的原則 (The principles of the International Phonetic Association)》(後來被1999年出版的《國際語音學會手冊(Handbook of the International Phonetic Association)》取代),其中提到的若干原則,至到今天仍是IPA委員會的決策指南。《原則》的要點簡單說明如下:

  1. 不同形狀的字母應該代表不同聲音。
  2. 不同語言中的相同聲音,應該由相同字母來表示。
  3. 所使用的字母,其字體形狀應該與羅馬字母和諧共處。
  4. 只在以下四種情況使用附加符號(diacritics):
    • 超音段,例如音長、重讀和語調;
    • 表示聲音的細微差異;
    • 使用附加符號可以避免重新設計一整套新的符號(例如用波浪號來代表鼻化元音)。
  5. 字母的發展應遵循音位原則和基本元音系統。

 

美國傳統

美式傳統的音標系統,則是始於19世紀晚期對北美土著語言的轉寫工作。在Boas (1911) 《美國印地安語言手冊 (The handbook of American Indian languages)》出版之後,美國人類學會(American Anthropological Association)的委員,包括Franz Boas, P. E. Goddard, Edward Spair, & A. L. Kroeber出版了建議用來描述美洲語言的轉寫系統。與IPA不同的是,美式用法對出版而言是比較「務實」的系統。這表現在許多方面,例如,它很明顯地避免發明新符號,因為新符號不在標準字型當中,不利於印刷出版。它認可音系取向的轉寫方式,將語音細節留待文字說明,以追求排版印刷的方便性。最後,它特別符合美國學者的需要,其目的是為美洲語言經常遇到的聲音提供字元,並非考慮涵蓋全世界所有語言的聲音。

 

兩者比較

美式用法比IPA用法更強調符號的「組合性」(compositionality)。簡單來說,IPA用法是盡量以不同符號來代表不同音位,而美式用法則是盡量減少符號。以元音來說,美式用法的前展唇元音和後圓唇元音以羅馬字母表示,而前圓唇和後展唇元音(圖2藍色格子),則是頭上加兩點(umlaut),十分對稱(元音前展後圓是所有語言的共性,所以常見元音採用羅馬字母,罕見的才加附加符號)。而IPA的元音盡量以不同符號來表示(圖3),附加符號則用來表示長度[aː]、鼻化[ã]、重讀[á]等等特徵。若以符號數量而言,IPA有28個,而美式用法只有18個(不計附加符號)。

圖2:維基百科的美式用法元音
ipa-vs-american-american-vowels

圖3:IPA的元音
ipa-vs-american-ipa-vowels

輔音系統的情況也差不多,IPA以不同符號來表示不同語音,而美式用法則使用很多附加符號,例如以腳下一點(underdot)表示往後(retracted)、腳下圓弧(subscript arch)表示往前(advanced)、頭上楔形(wedge)表示齦—顎(palato-alveolar)的擦音和塞擦音等等,大量減少新符號的數量。

總的來說,IPA傾向多用符號、少用附加,美式用法則是少用符號、多用附加。附加符號有好處也有缺點,好處當然是符號減少,系統對稱;但缺點也很明顯,附加符號通常很小,不易書寫和辨認(特別是手寫),這對於要求精確的語音學可說是致命傷。認同音系取向的轉寫方式,不免將音系特徵混入語音轉寫。最重要的一點,美式用法只針對美洲大陸的語言,可用範圍較為侷限。

《語音符號指南》

《語音符號指南 (Phonetic Symbol Guide)》這本書像是字典,每個語音符號作為一個條目,底下列出IPA用法、美式用法;以外還會加上說明、以及文獻來源;最後附上符號來源。例如以[ʒ]這個符號為例(p. 207),IPA用法是齦—顎舌葉濁擦音;美式用法通常以[ž]代替。其他用法,有些斯拉夫語言學家用來表示IPA的[dz]……(下略)。來源則是古愛爾蘭語……(下略)。透過這些說明,讀者很快就能瞭解一個符號的基本用法和歷史淵源。

當然,要在一本300頁的書中羅列所有語音符號是不可能的,所以作者只蒐羅了比較有代表性的語音符號。即便如此,語音符號的數量也超出IPA甚多。順便一提,我還在書中找到《國音學》所使用的[Ω]和[A],原來兩個符號都是美式用法,可說是解決了心中多年的疑惑。

如果是對語音學、音系學有興趣的人,手邊都該有這本字典,推薦給大家。

 

【參考文獻】

2010-10-31

美國大學有多少人學習中文

在全球化的時代,外語是一項必備的能力。以美國為例,大學的學生究竟學什麼外語呢?其中又有多少人學習中文?人數增加或減少?這些都是我很想知道的問題。
美國現代語言學會(Modern Language Asoosiation, MLA)受美國教育部的委託,每四年就將問卷寄給全美大學院校,調查各校的外語教學現況。以2006年為例,共有1,577,810人註冊外語課程。以人數而言,前三名是西班牙語(52%)、法語(13%)、德語(6%);漢語則排名第七,共有51,582人(3.27%),這也是漢語第一次擠進前十名。
language_enrollments_2006
若與前一次調查(2002年)相較,成長最快速的是阿拉伯語(+127%)、其次則是漢語(+51%)。阿拉伯語的成長顯然與九一一事件以來美國的國防政策有關,而漢語的成長,應該是受到中國高經濟成長的刺激。根據歷年的調查數字來看,漢語在2006年可謂高成長。1990至2002年的平均成長率約25%(每4年),然而2002到2006竟有51%,成長率是過去的兩倍。然而若以人數而言,漢語不過佔了全部人數的3.27%,只有區區5萬人,與西班牙語的82萬人比起來,還是小巫見大巫。
language_enrollments_2006_2
由於MLA是每隔四年做一次普查,所以2010年也應發放新一輪的問卷了,不過催收問卷、彙整資料尚須時間,調查結果恐怕得等到2011年才會公布。

【參考資料】
Modern Language Asoosiation. (2007). Enrollments in languages other than English in United States institutions of higher education, Fall 2006. Retrieved from http://www.mla.org/2006_flenrollmentsurvey

2010-09-29

換個布景主題

我對於網頁設計一向沒什麼天分,所以當初在Blogger建立帳號的時候,就直接從官方給的幾個布景當中選一個,幾年來用得也很習慣了。

不過最近因為自己換電腦的緣故,這才發現原來的布景有個致命傷:寬度不足。原先的布景是為了能在800 x 600的螢幕上顯示的,所以寬度很窄。而且版型又有美觀上的考量,所以兩邊都有留白,主體寬度僅剩700  px,側欄又佔掉150 px,結果文章的寬度只剩下430 px。以我自己的螢幕為例 (1920 x 1080),文章的430 px只有螢幕寬度的40%!換言之,兩邊留下大量的空白,眼睛只能在很小的範圍中移動,看起來很不舒服,所以我告訴自己:該換布景了。

首先要確定的是,現在螢幕解析度還使用800 x 600的人有多少,我查了w3schools的統計,發現大約是1%。1024 x 768的人約20%,剩下的76%都是更高的解析度(3%未知)。因此我希望布景能在1024 x 768的螢幕上正常顯示,而不需要來回拖動捲軸。

其次,我想維持原有的布景主題,畢竟布景就像人的外表一樣,是一種容易辨認的標誌。不過在研究過舊的布景之後我就放棄了。因為舊布景的寬度是固定的,包括背景圖片的寬度也是(有些布景在設計之初就考量不同寬度,所以比例尺是相對而非絕對的)。我當然可以將背景圖片等比例放大,不過這樣一來又面臨對齊的問題。我是一個懶惰蟲,所以這回還是從Blogger所提供的布景中選了一個,稍做修改就直接套用了。原本我希望header的方塊能夠做圓角,不過要修改還需要花點時間,以後等有空再來做吧!目前先這樣,也請大家給我意見。 ^^

【備註】
如果瀏覽網頁的時候,常常覺得字太小很難閱讀,可以將文字放大。IE 7.0以後就支援手動放大。我自己常用的Firefox,則是加裝了NoSquint,可以記憶各個網站的不同放大比例。Chrome也可以自訂,或用AutoZoom。Opera的話就更方便了,因為瀏覽器本身的放大功能就很好用。(話說現在的螢幕越來越大,怎麼文字卻越來越小呢 @_@?)

2010-09-11

外國口音導致可信度降低

口音影響心理

社會語言學很早就發現,說話者的口音(accent,或譯為「腔調」)會影響心理印象。比方說,如果小明的口音與標準發音接近,人們就會認為他是上流社會、受過良好教育。反之,如果小明是鄉村╱非標準口音,人們就容易認為他是工農階層。

為了證實這一點,我們可以讓小明來當發音人,要求他模仿標準口音與非標準口音。發音人都是小明,理論上並不會因為口音標準而變帥。但事實上,口音的確會影響他人的印象。只有聽到聲音時,人們容易認為標準口音的人比較聰明、比較正直、外貌較佳……等。這種實驗方法,社會語言學家叫做「配對偽裝」(matched-guise)。

 

外國口音降低可信度

既然口音會影響社會心理,那麼第二語言學習者的口音呢?Lev-Ari & Keysar 最近的研究發現,外國口音較重的人,別人不容易相信他所說的話,換言之,可信度降低了。這與內容無關,我們心理上就是會比較不信任有外國口音的人。

Lev-Ari & Keysar 的實驗方法是,將受試者分成三組,一組母語者(native speaker),兩組非母語者(non-native speaker),一組口音較輕,一組口音較重。研究者準備了幾十個句子,諸如:「螞蟻不會睡覺」、「長頸鹿在缺水時可以活得比駱駝久」這類句子,播放給母語者聆聽,讓他們判斷這個句子是否為真。第一次實驗,實驗者沒有告訴評分者任何事情,第二次則事先告訴他們:「本實驗的目的是測量,理解說話者言語的困難程度,是否會影響他們陳述內容的可信度」。結果發現,在不知情的情況下(實驗一),聽話者認為有外國口音的人,其內容可信度較低。但如果事先告知(實驗二),口音的輕重就會造成明顯的區別:輕口音的分數與母語者接近,但重口音的分數則是和原來差不多。  

 

若依理性判斷,口音的輕重不該成為判斷內容可信與否的標準。的確,母語者在聽到外國口音時,會認為外國口音「較難理解」。實驗結果發現,外國口音不僅影響理解程度多寡,同時也影響聽話者對言語可信度的評分。

 

小結

結論就是,外國口音會降低說話的可信度。聽話的人有沒有意識到說話者有外國口音,也會造成影響(母語者對外國人較寬容)。輕口音的影響較小。如果口音很重……那就沒救了。:p

下次如果你的外國學生不想練習發音,你可以拿〈每日科學〉的這篇報導給他看。^^y

【參考文獻】

2010-08-23

直接模仿的發音教學

外語發音教學,大致可以分為兩種:直覺模仿和語言分析。以下這段影片就是直覺模仿的範例,來自電影《粉紅豹 Pink Panther》。Steve Martin飾演法國的警探,為了追蹤逃到美國的犯人,努力學習英文發音……

 

I would like to buy a hamburger

2010-08-15

吳宗濟先生逝世

wu-zongji

我是從北大中文論壇得知這個消息的。 高齡101歲的語音學大家吳宗濟先生,已於2010年7月30日逝世。

 

還記得以前剛開始接觸實驗語音學時,想瞭解漢語的聲調,就曾閱讀吳先生對於兩字調、三字調、四字調的文章,對研究成果十分驚嘆。吳先生所編寫的《普通話發音圖譜》(1963)、《實驗語音學概要》(1989)影響深遠,至今仍是重要參考資料。我於2005年到北京社科院暫住的那段日子,也曾見過吳先生一面,那時心裡還想:「可惜沒把吳先生的書帶來,不然就可以請他簽名了。」不過心裡想歸想,終究是沒敢將「追星」付諸行動。

 

吳先生是中國語音學界當之無愧的大師,不僅本身著作等身,對於培養後進也不遺餘力。現在許多學者教授,都曾是吳先生的學生。去年大家還熱熱鬧鬧地幫吳先生慶祝百歲生日,也把研討會成果集結出版。沒想到時隔不久卻驚聞噩耗,一代大家的逝世,令人嘆息。

 

ps. 吳先生自述學思歷程的文章〈音路歷程〉生動有趣,推薦閱讀。

 

【延伸閱讀】

2010-08-12

新電腦!

CM370
(圖:CoolerMaster RC-370)

 

因為舊電腦已經不堪負荷了,所以在七月初組了一台新的桌上型。我是在台中Nova買的,總共33K,大約比原價屋的報價少500左右。

 

決策的過程大概是這樣的:首先決定CPU,我是Intel的愛用者。然後決定等級,雙核心 i3-530 以及四核心的 i5-750 二選一。考量可能會跑繪圖和遊戲,所以還是買四核的。最後就比較簡單啦,拿網路上相同等級的菜單來修改一下就好了。

 

組裝完也做了燒機測試,IBTPrime95都順利通過。但超頻則不太順利,使用Asus所附贈的TurboV EVO,超頻後CPU時脈可達3.7G,但IBT測試跑不過,溫度飆破100度。後來我又把時脈調回預設值,反正現在程式都跑得動,沒什麼超頻的必要。再說夏季電費比較貴,若因為超頻而多付電費有點划不來。

 

這次為了組裝電腦,上網做了很多功課,菜單也請PTT和mobile01的網友先過目,應該沒什麼問題。我很久沒碰硬體了,以前的知識可說是lag很久,趁此機會學習了不少新知。電腦這種東西,雖說早買早享受,但價格下滑很快,買自己合用的就好。

 

我的菜單

CPU Intel Core i5-750
MB Asus P7P55D-E
RAM Kinstone 2G-1333 x 2
VGA Lantic (喬帝) GTS 250 1G
HDD WD 1TB 1002 FAEX
DVD-RW Lite-On 24X
PSU be quiet! E6-450W
CHASSIS CoolerMaster RC-370
MONITOR ASUS VE246H
其它 CPU散熱器 CoolerMaster 風神鍛

2010-08-09

重啟部落格

writing
重啟爐灶
這個部落格荒廢已久。和老朋友見面時,chuzhen建議我繼續寫。我自己也想寫一些東西,不是為了宣揚自己,只是想留下一點日常生活的紀錄。我認為寫作即思考(writing as thinking),將腦中思維化為筆下文字,更可以有系統地整理自己的想法。當然,部落格也是一種抒發的管道,自我展現的舞台,這也是許多人喜歡寫部落格的原因。不過,我會盡量避免紀錄生活瑣碎。


學習語音
以前寫部落格,很少寫語音學,一來是有自知之明,覺得自己是個初學者,不好寫什麼東西,就算寫了也很容易犯錯。二來是怕得罪人,網路是公開的園地,評論、心得什麼的可能就會得罪別人而不自知。所以從前我喜歡寫讀書心得、數位學習,反正咱不懂嘛,寫錯了也只是外行人班門弄斧,無傷大雅。

不過這回重啟爐灶,我想專注於語音學。想在部落格裡發表,大概是因為我離開學校很久了,部落格讓自己有點壓力,繼續讀一些語音學的書。當然犯錯是免不了的,不過後來我覺得犯錯也是學習的過程,所以就懷著「敝帚自珍」的心情繼續寫了。如果您發現我寫的文章有錯誤,還請不吝指教。
 

勇敢面對
《新世紀福音戰士》的主角碇真嗣有一句著名的台詞:「不能逃避!不能逃避!不能逃避!」(逃げちゃダメだ)正是此刻我的心情寫照。過去兩三年因為求學的挫折,變得十分自閉(Fish說我是蛤蠣),不敢與他人打交道,就連email和電話都不敢回、不敢接。一味逃避的結果,就是讓自己變得更孤獨。經過這些時間的沈澱,我想重新站起來,勇敢面對自己的缺點,繼續往下個目標邁進。如果之前您曾和我聯繫卻沒有回應,準棒向您道歉。此前不過是一個自閉小孩的偏激行為,請原諒我的無禮。

從今以後,請大家多多指教!