[摘要]LABB-CAT是一款基于瀏覽器的語(yǔ)言學(xué)研究工具,它可以存儲(chǔ)錄音和正則表達(dá)式的可搜索的訪談文字記錄,搜索結(jié)果、整個(gè)筆錄和媒體,可以以各種格式查看或?qū)С。功能介紹媒體和記錄本的存儲(chǔ)LaBB-CAT本質(zhì)...
LABB-CAT是一款基于瀏覽器的語(yǔ)言學(xué)研究工具,它可以存儲(chǔ)錄音和正則表達(dá)式的可搜索的訪談文字記錄,搜索結(jié)果、整個(gè)筆錄和媒體,可以以各種格式查看或?qū)С觥?/p>
功能介紹
媒體和記錄本的存儲(chǔ)
LaBB-CAT本質(zhì)上是一個(gè)音頻/視頻記錄的時(shí)間對(duì)齊謄本的存儲(chǔ)庫(kù)。 可使用Transcriber、Praat或ELAN(可用于創(chuàng)建一個(gè)文件,將謄本文本與音頻/視頻記錄中的相應(yīng)位置對(duì)齊)制作時(shí)間對(duì)齊的謄本。然后,謄本被上傳到LaBB-CAT,它允許存儲(chǔ)有關(guān)發(fā)言人和謄本的附加信息。
來(lái)自Transcriber、Praat或ELAN的謄本。
征求意見(jiàn)的任務(wù)
您還可以定義誘導(dǎo)任務(wù),包括提示參與者閱讀和問(wèn)題,讓他們回答。
當(dāng)參與者完成任務(wù)時(shí)(使用他們的瀏覽器或移動(dòng)設(shè)備),他們的語(yǔ)音會(huì)被記錄下來(lái)并自動(dòng)直接上傳到LaBB-CAT。
自動(dòng)注釋
結(jié)合信號(hào)數(shù)據(jù)、原始正字轉(zhuǎn)寫(xiě)本以及一些第三方數(shù)據(jù)和工具,可以對(duì)轉(zhuǎn)寫(xiě)本進(jìn)行自動(dòng)標(biāo)注,例如。
詞匯標(biāo)簽
來(lái)自CELEX的注釋借助CELEX的數(shù)據(jù),可以用更多的數(shù)據(jù)自動(dòng)注釋單詞。
語(yǔ)音學(xué)
教學(xué)大綱
形態(tài)學(xué)
語(yǔ)氣
頻率
其他詞典也可以整合,包括CMU發(fā)音詞典和Unisyn詞典。
強(qiáng)制對(duì)齊
在HTK或WebMAUS的幫助下,在語(yǔ)句層面對(duì)齊的抄本可以強(qiáng)制對(duì)齊到詞和段層面。
用HTK強(qiáng)制對(duì)齊
統(tǒng)計(jì)層
LaBB-CAT數(shù)據(jù)庫(kù)本身的詞頻數(shù)據(jù)可以直接對(duì)每個(gè)詞進(jìn)行計(jì)算和標(biāo)注。
詞頻層
語(yǔ)言學(xué)探究和字?jǐn)?shù)"(LIWC)可以用來(lái)比較語(yǔ)料庫(kù)和參考語(yǔ)料庫(kù)。
LIWC比較
結(jié)合CELEX的時(shí)間排列信息和音節(jié)數(shù),可以計(jì)算出不同領(lǐng)域的語(yǔ)音率。
每分鐘的音節(jié)數(shù),行和轉(zhuǎn)彎的音節(jié)數(shù)
斯坦福解析器
在Stanford Parser的幫助下,可以為轉(zhuǎn)錄本生成可編輯的句法樹(shù)。
跨越句法成分的注釋。
解析樹(shù)表示法
腳本
腳本可以用Python或Javascript編寫(xiě),以執(zhí)行arbtrary計(jì)算和注釋任務(wù)。
用于計(jì)算對(duì)偶變異性指數(shù)的Python腳本
IBM Watson人格洞察力
LaBB-CAT可以與IBM Watson的Personality Insights網(wǎng)絡(luò)服務(wù)集成,對(duì)抄本進(jìn)行人格分析。
手動(dòng)注釋
注釋可以手動(dòng)添加,比如說(shuō)。
主題標(biāo)簽
針對(duì)單個(gè)單詞的文本標(biāo)簽
時(shí)間點(diǎn)或區(qū)間可以使用Praat進(jìn)行注釋。
使用Praat對(duì)點(diǎn)進(jìn)行標(biāo)注
檢索
一旦記錄本和注釋到位,就可以對(duì)符合特定標(biāo)準(zhǔn)的記錄本進(jìn)行搜索(例如,基于發(fā)言者的年齡/性別、記錄本所屬的語(yǔ)料庫(kù)等)。
按屬性過(guò)濾發(fā)言者
當(dāng)發(fā)言者被選中后,可以在不同的層中搜索他們的語(yǔ)句,以尋找文本或常規(guī)表達(dá)。
在 "成人 "話題中搜索 "the",然后在音素層搜索以I、E、i或@開(kāi)頭的單詞。
這將返回與查詢相匹配的所選抄本中所有語(yǔ)句的列表。
搜索結(jié)果
如果需要,可以將此列表連同相關(guān)的演講者和注釋信息直接導(dǎo)出到csv文件,以便在Excel或R中進(jìn)行進(jìn)一步分析。
搜索結(jié)果
或者可以提取音頻樣本進(jìn)行分析。
從結(jié)果中提取音頻
或者可以直接使用EMU-webApp編輯語(yǔ)句注釋和對(duì)齊。
使用EMU-webApp編輯手機(jī)對(duì)齊。
如果語(yǔ)句已被強(qiáng)制對(duì)齊,可以用Praat對(duì)目標(biāo)語(yǔ)段進(jìn)行批量處理。
用Praat進(jìn)行批量處理,以提取形體和其他聲學(xué)措施。
批量Praat處理可以包括您自己的自定義Praat腳本。
自定義Praat腳本,用于搜索結(jié)果的批量處理。
另外,點(diǎn)擊搜索返回的語(yǔ)句,就會(huì)產(chǎn)生有關(guān)發(fā)言者的完整文字記錄,與相關(guān)語(yǔ)句一起置于屏幕頂部?梢渣c(diǎn)擊謄本的任何部分,并播放媒體的相應(yīng)部分。
交互式文字稿
直接從交互式轉(zhuǎn)錄頁(yè)面播放媒體,顯示其他注釋層,提取該行的音頻,或在 Praat 中打開(kāi)包含注釋的相應(yīng) TextGrid。可以添加、編輯或刪除注釋,并調(diào)整對(duì)齊方式。
電腦學(xué)習(xí)軟件,可以很好的幫助提高孩子的學(xué)習(xí)成績(jī),老師們也可以來(lái)下載教育教學(xué)軟件,輔助教學(xué),提高教學(xué)質(zhì)量。