Поэтому интересный пост писать сегодня не хочу. Напишу ерунду.
В японском языке нет пробелов. Как же можно без напряга читать японские тексты? Как определять, где одно слово кончается, а следующее начинается? Честно говоря, я об этом не задумывался. Читал и читал. Но теперь подумал.
Тут есть две смежные проблемы: а) как определить конец слова б) как определить начало слова.
В японском языке тексты пишутся на смеси иероглифов (знаков, имеющих и смысл и чтение) и т.н. "хираганы" (эти знаки имеют только чтение). Иероглифами обычно записываются знаменательные слова. То есть те, которые имеют смысл. А хираганой записываются окончания слов и служебные слова, не имеющие собственного смысла.
Очевидно, что при записи иероглифы и хирагана будут постоянно между собой чередоваться. И каждое следующее смысловое слово будет начинаться с иероглифа.
А теперь главный ключ. Иероглифы и хирагана выглядят очень по-разному. Иероглифы угловатые (например, 本, 曜, 顰


Поэтому начало каждого слова в тексте определяется чисто визуально. Вот пример текста из Википедии, свободной энциклопедии:
海産物を特に嫌っており、このことは彼の作品に登場する邪神たちの造形に強く影響を及ぼしている。逆に好物はチーズ、チョコレート、アイスクリームで、これは母親が彼の好むものだけを与えたことによる。酒・タバコは嗜まなかった。また極端な寒さ嫌いで、これもまた『冷気』などの作品に反映している。芸術作品については、彼の作品に見られるものと同じく、古いものを愛した。絵画に関しては風景画を好み、建築に関しては機能的な現代様式を嫌い、ゴシック建築を好んだ。あらゆる種類のゲームやスポーツに関心がなく、古い家を眺めたり、夏の日に古風で風景画のように美しい土地を歩き回ることを好んだ。幼い頃にヴァイオリンを習わせられていて、これが好短編『エーリッヒ・ツァンの音楽』などに若干反映されているが、音楽に関する好みは貧弱であった。
С концами слов сложнее. Тут уже приходится думать. Если слово состоит из двух и более иероглифов, то оно, как правило, не имеет окончания (потому что слова из нескольких иероглифов заимствованы из китайского языка "как есть", а там нет окончаний). Поэтому последний иероглиф перед хираганой -- это конец слова. Однако если слово состоит из одного иероглифа, то обычно это исконно японское слово. В таких словах может как быть окончание, так и не быть. Тут возможны несколько вариантов:
иероглиф -- служебное слово -- следующий иероглиф
иероглиф -- окончание -- следующий иероглиф
иероглиф -- окончание -- служебное слово -- следующий иероглиф
При этом окончание может быть замешано из 3-4 кусочков, каждый из которых немного меняет смысл иероглифа, к которому они относятся (т.е. предыдущего). Это называется агглютинация.
Тут ключ в другом. Служебные слова, даже если они есть, тоже меняют смысл предыдущего иероглифа. Поэтому нет никакой нужды разделять окончание и служебное слово. Их надо брать одной кучей и разбирать, что они делают с иероглифом.
А вот как люди умудряются читать КИТАЙСКИЙ текст -- мне действительно интересно.