原則は句点またはピリオドが見つかるまでを「文」とします。
ただし、以下の条件を満たすピリオドは文区切りとみなしません。
- アラビア数字+ピリオド
【例】「1. はじめに」
- 漢数字+ピリオド+漢数字
【例】「一.五%」
- アルファベット+ピリオド+空白以外
【例】「U.S.A.」
※最後のピリオドは文区切りとみなします。
◆補足
改行については、改行が文の途中に挿入されたものと判定されるかどうかに依存します。
文中の改行と判定された場合は、改行前後の段落文字列を結合して解析するため、改行以降の「。」を探しますが、そうでない場合は改行までとなります。