zHz00 Untitled

четверг, 02 ноября 2017
23:59 Whole words only
В большинстве дневников слетело оформление до такой степени, что прям слетело-слетело.

Поэтому интересный пост писать сегодня не хочу. Напишу ерунду.

В японском языке нет пробелов. Как же можно без напряга читать японские тексты? Как определять, где одно слово кончается, а следующее начинается? Честно говоря, я об этом не задумывался. Читал и читал. Но теперь подумал.

Тут есть две смежные проблемы: а) как определить конец слова б) как определить начало слова.

В японском языке тексты пишутся на смеси иероглифов (знаков, имеющих и смысл и чтение) и т.н. "хираганы" (эти знаки имеют только чтение). Иероглифами обычно записываются знаменательные слова. То есть те, которые имеют смысл. А хираганой записываются окончания слов и служебные слова, не имеющие собственного смысла.

Очевидно, что при записи иероглифы и хирагана будут постоянно между собой чередоваться. И каждое следующее смысловое слово будет начинаться с иероглифа.

А теперь главный ключ. Иероглифы и хирагана выглядят очень по-разному. Иероглифы угловатые (например, 本, 曜, 顰;). Хирагана же круглая (например,  の, ふ, ゑ;).

Поэтому начало каждого слова в тексте определяется чисто визуально. Вот пример текста из Википедии, свободной энциклопедии:

海産物を特に嫌っており、このことは彼の作品に登場する邪神たちの造形に強く影響を及ぼしている。逆に好物はチーズ、チョコレート、アイスクリームで、これは母親が彼の好むものだけを与えたことによる。酒・タバコは嗜まなかった。また極端な寒さ嫌いで、これもまた『冷気』などの作品に反映している。芸術作品については、彼の作品に見られるものと同じく、古いものを愛した。絵画に関しては風景画を好み、建築に関しては機能的な現代様式を嫌い、ゴシック建築を好んだ。あらゆる種類のゲームやスポーツに関心がなく、古い家を眺めたり、夏の日に古風で風景画のように美しい土地を歩き回ることを好んだ。幼い頃にヴァイオリンを習わせられていて、これが好短編『エーリッヒ・ツァンの音楽』などに若干反映されているが、音楽に関する好みは貧弱であった。

С концами слов сложнее. Тут уже приходится думать. Если слово состоит из двух и более иероглифов, то оно, как правило, не имеет окончания (потому что слова из нескольких иероглифов заимствованы из китайского языка "как есть", а там нет окончаний). Поэтому последний иероглиф перед хираганой -- это конец слова. Однако если слово состоит из одного иероглифа, то обычно это исконно японское слово. В таких словах может как быть окончание, так и не быть. Тут возможны несколько вариантов:

иероглиф -- служебное слово -- следующий иероглиф
иероглиф -- окончание -- следующий иероглиф
иероглиф -- окончание -- служебное слово -- следующий иероглиф

При этом окончание может быть замешано из 3-4 кусочков, каждый из которых немного меняет смысл иероглифа, к которому они относятся (т.е. предыдущего). Это называется агглютинация.

Тут ключ в другом. Служебные слова, даже если они есть, тоже меняют смысл предыдущего иероглифа. Поэтому нет никакой нужды разделять окончание и служебное слово. Их надо брать одной кучей и разбирать, что они делают с иероглифом.

А вот как люди умудряются читать КИТАЙСКИЙ текст -- мне действительно интересно.

@темы: Японский язык, Восприятие

URL
Жевал можжевельник. Hадувал лягушек. Размышлял о смысле ж...
Ты кажешься ребенком Тихим, милым... Но за твоими Хруп...
до чего ж все лень!...ну просто очень лень!
Гм... Довольно удручающее извещение: http://yellow.spider...
Не спи за рулем - стране нужен каждый налогоплательщик
Чёрт! Мало того что редактировать записи из клиента нель...

03.11.2017 в 10:39

03.11.2017 в 10:39
Напишу ерунду.

Пиши ерунду почаще)
URL

03.11.2017 в 11:50

03.11.2017 в 11:50
Угу, я тоже недавно кому-то похоже отвечал:

Q: [...] Как в японском языке отделять друг от друга слова? А то не поймёшь, где начало слова, а где конец.

A: Угадывать! Большинство слов выглядят как "1-2 кандзи+хвост" (走る、話す;) или "кандзи+кандзи" (学校;), или "4 кандзи" (絶体絶命;), или что-то парное типа "ドキドキ". Хвосты все стандартные (る、す、む и т.д.), между словами тоже стандартные частицы (は、が、を、に、と итп) и связки (типа から、まで、にしても;). Когда вы к ним немного привыкнете, то текст будет сам распадаться на слова из-за этого.

То есть, вот вы смотрите:
学校に辿り着いたとき彼はすでにそこにいた
学校 это явно слово, за ним частица に, потом
辿り着いた - может быть 辿り + 着いた 2 слова или 辿り着いた 1 слово, разница невелика (это одно слово, но оно вот так из 2х и слепилось исторически)
とき это вы знаете
彼 это явно слово, за ним частица は
すで+に вы знаете
そこ+に знаете
いた - явно глагол, раз в конце (ну и в этом примере он простой)
URL
Добавить комментарий

Расширенная форма

Подписаться на новые комментарии
Получать уведомления о новых комментариях на E-mail