2005年3月23日

遇到的問題

目前有一個問題

如何在得到的字數串中取得標準差最小的組合

單純使用huffman codec的方式並無法得到最balance的結合。



討論

MY Project<PW>

pw的流程:

1. 尋訪Parsing Tree

i. if (node >= 3 && node <= 5) 則直接確認為prosodic word

ii. if (node > 5 ) 再切割,去拜訪其它的節點

iii. output一個word and tag的root指標,其中有些已設定成pw

2. Combine another Word for Prosodic words

i. 將得到的字數陣列作合併

ii. 遇到搶詞的時候以規則判斷<加入詞性合併的機率>

iii. 將原先的word and tag全部設定為pw