X



日本語、情報密度の低い言語だった
■ このスレッドは過去ログ倉庫に格納されています
0001以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:31:47.318ID:5NxyYiRC0
例えば英語の"demonstrate"という単語は、文字数は11あるものの、母音は3つしかなく、したがって音節も3つとなります。日本語の「デモンストレート」にすると、音節は8と2倍以上に膨れ上がります。

このような言語間における情報密度の違いついては、定量的な分析が存在しています。フランスのリヨン大学の研究チームが2011年に発表した「複数の言語におけるスピーチ情報密度の違い」(原題"A cross-language perspective on speech information rate")です。

この研究によれば、単位時間内に伝達できる情報量は、ベトナム語を1とした場合、以下のような差が生じます。

ベトナム語:1
英語:1.08
フランス語:0.99
スペイン語:0.98
イタリア語:0.96
北京語:0.94
ドイツ語:0.90
日本語:0.74
比較されている8言語の中では、情報密度において英語が頭ひとつ抜けているものの、他の言語では大きな差はなく、日本語だけが大幅に低いことが明らかになっています。日本語(0.74)は、英語(1.08)と比較して情報密度が68%しかない言語なのです。
0002以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:32:30.813ID:b+HNgzR00
むしろそんな高かったの
0004以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:33:03.543ID:xmPi5PgTd
だから外人って略しても怒らないで
0005以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:34:00.650ID:sngmjtY2M
洋書と翻訳本の厚さを比較すればわかる話
VIPはインテリだから今すぐ本棚見て確認できるよな?
0006以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:34:18.245ID:Co/wHKPu0
2バイト文字な時点でゴミ
0007以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:34:26.929ID:Te/QD5sW0
で?
0010以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:35:44.068ID:BukMaMqU0
単位時間内←しょーもない縛りがあって草
0011以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:36:24.698ID:xdZ/HGzzp
そんなに短く伝えたいのか?
0012以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:38:02.096ID:J5qyATjb0
日本語じゃなくてカタカナ読みにしただけじゃん
0013以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:38:31.042ID:xdZ/HGzzp
>>5
demonstrationなんて漢字にしたら実演だぞ
そんな分厚くなるかよw
0014以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:39:13.697ID:RwB4FNt00
日本語の「デモンストレート」?

これが日本語?
0016以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:40:36.285ID:eouTXs380
歌詞の情報量の違いは子供でも気づいてる
0017以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:40:46.212ID:edf8PlKka
>例えば英語の"demonstrate"という単語は、文字数は11あるものの、母音は3つしかなく、したがって音節も3つとなります。日本語の「デモンストレート」にすると、音節は8と2倍以上に膨れ上がります。

これがそもそもズルすぎて笑った
0018以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:41:13.121ID:/dnI4K2M0
柳沢なんてなんの事がない名前だけどアメリカ人に紹介するとかなり戸惑う
yanagisawa??? 読めない!と
0019以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:42:06.691ID:b9yCdwd00
ルー大柴基準なの?
0020以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:43:03.661ID:Wh32HfI7p
じゃあ実演を英語に直したら?
0021以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:43:14.280ID:cgxJ0nx2a
同じ読み方するなら英語だろうとカタカナだろうと音節とか変わらないのでは…?
0022以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:43:40.306ID:BukMaMqU0
デモンストレート→悪霊直線

これでいいか?
0023以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:43:55.072ID:nJY+6/gg0
日本語は音節単位じゃなくてモーラ単位で考えないと
0024以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:44:09.074ID:xO/81NO90
百二        ひゃくに
one hundred two  ワンハンドレッドツー
0025以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:46:35.014ID:rtAFM7rir
>>24
あー日本語数学強いんだよなあ
まあ英語がゴミカス過ぎるのはあるけど
0026以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:46:40.085ID:TMagpRTI0
デモンストレートも4音節じゃね?
0028以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:47:09.132ID:l3m8ram2r
漢字で書くと文字あたりの情報密度は高くなるぞ
ツイッターやってて実感した
0029以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:47:33.278ID:nJY+6/gg0
ひゃ/く/に 3音節
one hund/red two 4音節

それほど音節数は変わらない
0030以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:48:44.717ID:drocdIBDd
デモンストレートって日本語があんの?
0031以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:49:18.205ID:/dnI4K2M0
日本語に翻訳するとページ数は1.5倍になるんだよ
0032以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:49:27.839ID:toACyGuha
でもフランス語数字読みづらいじゃん
0033以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:49:45.636ID:ydVqc38o0
>>17
もうなんちゃって研究で
よく発表できたなって話だね
0034以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:50:07.059ID:ydVqc38o0
>>31
逆こそ増えないか?
0035以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:52:33.389ID:lUq2PpaLM
デモって言葉に置き直してるけど
0036以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:53:50.349ID:YWa+dUFla
結局問題は翻訳(しかも直訳)すると大体文量膨らむってことなんじゃないの
0037以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:54:21.966ID:/dnI4K2M0
>>34
なぜ日本語にするとページ数が増えるかと言うと回りくどい書き方をしないと原文の意味が伝わらないから
逆に日本語を英語にすると論理のいい加減差が発覚する
0038以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:54:49.578ID:rhLIbLWQ0
でも日本人は言葉にしなくても通じあえるから
0039以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:56:11.810ID:5Ov21GU1d
略語や中国語由来の熟語を頻繁に使うのはそのせいなんだろうか
0040以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:56:25.295ID:OthBlC5j0
>>12

>>14
0041以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 12:58:28.675ID:rhLIbLWQ0
英語は主語は省略できないけど
日本語は主語省略しまくれる
主語省略して普段の話し言葉として考えて0.74なん?
0042以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:01:45.498ID:ydVqc38o0
>例えば英語の"demonstrate"という単語は、文字数は11あるものの、母音は3つしかなく、したがって音節も3つとなります。日本語の「デモンストレート」にすると、音節は8と2倍以上に膨れ上がります。

日本語で2、3文字のもの、日本語や漢語由来のものを英語にすると
すぐに10文字以上の英単語で
わりと複数の単語で構成される

持論と結論と自国語母語ありきのどうでもいい調査論文
0043以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:04:59.338ID:/dnI4K2M0
日本人は受け身を使いたがる、凄く気持ち悪いらしい
主語を省略できるからだと思うが、即座に「誰が?」と返ってくる
英語民の言葉に対する感覚はかなり厳しい気がする
0044以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:05:00.376ID:n6TEYEYn0
日本語じゃなくてワロタ
0045以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:10:27.044ID:PBsPjbc70
「っす」「サセン」に英語の本一冊分くらいの情報量があるから
0046以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:15:07.726ID:0CA/WU0f0
この温度の>>1で立て逃げなのか…
0047以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:16:58.652ID:/dnI4K2M0
I come from Alabama with my banjo on my knee
なんて言い方好きだわ、日本語の3倍くらい表現力が豊か
0049以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:19:02.051ID:XAArNW490
25x35x250=218750
20x30x350=210000

ある小説の英語原作と日本語訳のおよその文字数
0050以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:20:02.904ID:QoF+xPKA0
自分が望む結論を導くために言語の特定の側面だけに着目した恣意的な調査だな
「スピーチ情報密度の違い」だけ見てもしょうがないだろ
現代社会における重要な情報伝達って「話し言葉」よりも「書き言葉」の方が使用頻度高いだろうに
後々まで残しておきたい重要な情報は音声ではなく文字によって書類や本という形で残してる
(音声だと、いちいち録音したものを再生してると時間かかりすぎる)
文字に着目した場合、漢字を使う言語の方が圧倒的に情報量高いぞ
0051以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:22:41.181ID:/dnI4K2M0
そう思うんだったら漢字で残しなよ
プログラミング言語も日本語ベース漢字ベースにしたら素晴らしいものが出来るかも
0052以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:26:09.326ID:y5BZPvqe0
I'm a pen.
私はペンです。

確かに
0053以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:27:08.427ID:AdSIgz3w0
実証つったら情報量増える
つまり熟語間での情報量に違いはない
0054以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:27:43.831ID:imlpBBC50
戸田奈津子
0055以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:31:18.175ID:/dnI4K2M0
誤字脱字の指摘だけして偉くなったつもりの池沼日本人
0056以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:31:53.192ID:U5bS/eysp
日本語の特徴は主語がなくても話が通じること
これ何気に凄くね?
0057以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:33:37.660ID:mOO1onwn0
北京語でデモンストーレトってどう書くんだ?
0058以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:33:54.411ID:EQEUemUZ0
ドントウォーリーアイムウェアリング
0059以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:34:56.205ID:Ee+UDA7c0
>>58
パーンツ!
0060以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:35:49.851ID:EQEUemUZ0
主語じゃなくて目的語だった
0061以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:35:56.887ID:PD4Ru5q50
なんでベトナム語が基準なんだ?
0062以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:37:12.951ID:bJ0hwvNzF
漢字を無くした南半島国と今でも漢字使ってる北半島国の言葉比べたらどうなんだろ
漢字混じりって最強だと思うよ
0063以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:38:18.445ID:A6dRe8Vb0
ベトコンなんかなまなめなめなめなまなめーしか言ってねえだろしかも意味がない
0064以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:38:42.664ID:/dnI4K2M0
>>56
誰が何をした、誰によって引き起こされたと言う一番重要なことをごまかしてる
根底には日本人の思考があるんだと思う
日本で公用語を英語にしたら受け身で主語省略ばかりの変な英語が出来ると思う
0065以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:39:48.699ID:Gujns/SWa
膠着語と孤立語比べてもなと思ったけどここに書いてあること見るとようは自国語がみんな可愛いんだな
そして他言語には粗探し
0066以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:40:02.794ID:Ioq67tfR0
>>5
逆になってない?
同じ情報量なのに洋書だと分厚い前後編冊の小説が
和訳されるとそこそこの厚さの文庫1冊とかざらにある

日本語は文字にしたときの情報密度は無茶苦茶高いぞ
0067以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:43:17.177ID:PD4Ru5q50
各国にあるであろう聖書の厚さで比較してみるといいかも
0068以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:43:58.614ID:ZkDEVW1KM
ベトナム語は声調あるから発音は短いだろ
それと比較すると他言語は長くなる
0070以下、5ちゃんねるからVIPがお送りします
垢版 |
2023/07/06(木) 13:47:37.788ID:HqbHJBkV0
>>64
別に反論じゃないんだが、実はそれには言語学的バックグラウンドがある
そもそも古来の文献にでてくる日本語表現は「~なりにけり」系だ。それ以外はなかったそうだ。英語で言うところの「There is/ There are」しか無かったと言える
風景や季節の描写がメインで「そこに山があり、桜の木がある」という主語がないような文章ばかりだったそうだ
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況