Всё (или почти всё) о пробеле. Всё (или почти всё) о пробеле Является ли пробел знаком
Как следует из заголовка, речь в статье пойдёт о неотъемлемой части любого русскоязычного (и не только) текста - о пробеле. Мы затронем историю пробела, виды пробелов, вопросы употребления пробела в веб-типографике.
Вообще говоря, пробел - это любое пустое место в рукописном, печатном или отображаемом на любом другом носителе тексте. Так что пробелы бывают разные:
- спусковые (большие вертикальные пропуски в первой полосе издания) и концевые пробелы полосы,
- абзацные отступы и концевые пробелы абзаца,
- межстрочные пробелы (между строками текста),
- межсловные пробелы (между словами в одной строке),
- межбуквенные пробелы (между буквами в слове).
История межсловного пробела
Межсловный пробел - сравнительно позднее изобретении в истории человеческой мысли. Глубоко история пробела изложена в книге Пола Санджера (Paul Saenger) «Space between Words: The Origins of Silent Reading», а также, несколько менее глубоко, в книге Иоганнеса Фридриха «История письма».Также есть неплохая статья Антона Бизяева о пробелах и об их истории «В начале пробелов не было» , которая была опубликована в 1997 году в журнале «Publish».
Вкратце, пробел появился достаточно поздно, в тех письменностях, где отсутствие разграничения слов приводило к сложности чтения (так называемое консонантное письмо, где записываются только согласные звуки). Однако в греческом и латыни, в которых записывали и гласные звуки, использование пробела было утеряно. Пол Санджер связывает это с тем, что чтение производилось вслух, что упрощало разграничение слов при восприятии текста.
Вновь пробел начал использоваться приблизительно в VII-IX вв. н. э., и эта традиция пришла из Ирландии, где у писцов и чтецов родным языком являлся древнеирландский, а религиозная литература записывалась на латыни. По-видимому, по этой причине монахи испытывали трудности с чтением вслух. Считается, что появление пробела плотно связано с постепенным переходом от чтения вслух к чтению про себя. Примерами книг на латыни с межсловными пробелами являются памятники британской литературы: Евангелие из Дарроу (VII в.) и Келлская книга (VIII-IX вв.).
В глаголице и кириллице пробел также отсутствовал, и в привычном нам смысле используется только с XVII века.
До того, как человечество изобрело наборный шрифт, никакой особенной классификации межсловных пробелов не было - ставили писцы пробелы на глазок и ставили. Напомню (мы писали об этом в статье «Выключка по ширине»), что рукопись и ксиллография относятся к способам создания текстов без подвижности литер. Естественно, пробелы могли получаться различной ширины, так как пропуски делались вручную.
Пробелы в ручном наборе
Когда подвижность литер появилась (а произошло это с появлением наборных шрифтов), появились соответственно и вопросы - а как же ставить пробелы, чтобы соблюдалась выключка по ширине?Технология ручного набора такова, что набранная строка полностью зажимается в верстатке и в гранке, и, соответственно, должна иметь ширину, практически точно равную ширине полосы (подробнее с технологией ручного набора можно познакомиться в одноимённой книге М. В. Шульмейстера).
Строка при ручном наборе набиралась из литер (брусков, на торце которых делались выпуклые зеркальные копии букв, отпечатывающиеся на бумаге), а межсловные пробелы создавались с помощью так называемых шпаций - брусков различной толщины, у которых на торце нет печатающей поверхности. Выглядит это примерно вот так . Шпации для каждого кегля шрифта, естественно, выпускались свои, и имели различную ширину. Например, для шрифта кегля 10 пунктов (стандартный кегль для большинства текстовых изданий) выпускались шпации шириной 10, 5, 4, 3, 2 и 1 пункт.
Шпации шириной в кегль назывались кегельными или круглыми. Шпации в половину кегельной назывались полукегельными или полукруглыми. Также существует название «тонкая шпация», под которой понимают шпации толщиной 1-2 пункта для шрифта кегля 8-12 пунктов. То есть, для шрифта кегля 10 пунктов тонкая шпация обычно составляет 2 пункта (соответственно, 1⁄5 кегельной). Однако, в связи с отсутствием точного определения тонкой шпации, в руководствах издателя, редактора и верстальщика обычно говорят не об отбивке на тонкую шпацию, а об отбивке на столько-то пунктов (считая, что кегль шрифта равен 10 пунктам).
Таким образом, нужно понимать, что в зависимости от кегля шрифта доля круглой шпации (треть, четверть и т. п.) может иметь разную ширину в пунктах, и наоборот.
Традиционная ширина межсловного пробела
Итак, разобравшись с тем, что такое круглая и полукруглая шпации, перейдём к принятой в российском наборе ширине собственно межсловного пробела.Шульмейстер пишет (стр. 94), что при наборе строки между словами ставится полукруглая. Когда строка набрана до конца, в большинстве случаев её ширина оказывается либо меньше, либо больше ширины полосы набора. Поэтому верстальщику приходится изменять ширину пробелов, уменьшая её минимум до 1⁄4 круглой и увеличивая максимум до 3⁄4 круглой (соответственно, при наборе кеглем 10 пунктов межсловные пробелы могут варьироваться от 3 до 7 пунктов). Естественно, бывают нюансы, зависящие от формата издания, но мы их касаться не будем.
Однако, Шульмейстер оговаривается, что сам по себе межсловный пробел в полукруглую великоват, и использование стандартного пробела в 1⁄3 круглой является как более экономичным с точки зрения расхода бумаги, так зачастую и более красивым. Также использование межсловного пробела в полукруглую не рекомендуется для узких шрифтов.
С появлением строкоотливных машин пробелы стали делаться равномерными по ширине в пределах одной строки, а ширина межсловного пробела стала варьироваться около 1⁄3 круглой.
Компьютерный набор и веб-типографика
В настоящее время мы ограничены возможностями используемых шрифтов, и, естественно, набором символов в Unicode. Нужно помнить, что далеко не все шрифты содержат большинство пробельных Unicode-символов.При переходе к компьютерным системам вёрстки был совершён переход от указания ширины шпаций в пунктах к указанию ширины шпаций в долях круглой, так как шрифты стали легко масштабироваться до любого кегля, а пробельные элементы должны были оставаться пропорциональными кеглю шрифта.
Символы пробела в Unicode
В Unicode предусмотрены следующие символы для пробелов западной типографики.- Межсловный пробел , U+0020, - ширина от 1⁄5 до 1⁄2 круглой в зависимости от шрифта. Для средних шрифтов межсловный пробел имеет ширину порядка 1⁄4 круглой (например, Times New Roman имеет именно такой пробел), для широких - порядка 1⁄3 круглой (Microsoft Verdana - 0,35 круглой, Microsoft Tahoma - 0,31 круглой).
- Неразрывный межсловный пробел , U+00A0, - имеет ту же ширину, что и обычный межсловный пробел, но в месте неразрывного пробела запрещён разрыв строки.
Все остальные пробельные символы имеют фиксированную ширину и не растягиваются при выключке строк по ширине. Вместе с тем, согласно алгоритму разрыва строк в Unicode , все они должны обрабатываться как точка разрыва строки.
- Круглая шпация , U+2003, - как было сказано, имеет ширину, равную размеру кегля. Также называется Em Space, возможно, потому что буква «M» в каких-либо старых шрифтах имела такую ширину. Вместе с тем, сейчас это выполняется далеко не везде, и поэтому утверждение, что Em Space всегда имеет ширину буквы «M» - заблуждение.
- Полукруглая шпация , U+2002, - половина круглой. Также называется En Space, возможно, потому что буква «N» в каких-либо старых шрифтах имела такую ширину. Вместе с тем, сейчас это выполняется далеко не везде, и поэтому утверждение, что En Space всегда имеет ширину буквы «N» - заблуждение.
- Третная шпация , U+2004, - треть круглой. По-английски называется Three-per-Em Space.
- Четвертная шпация , U+2005, - четверть круглой. По-английски называется Four-per-Em Space.
- Одна шестая круглой , U+2006, . По-английски называется Six-per-Em Space.
- Тонкая шпация , U+2009, - обычно имеет ширину в 1⁄5 круглой (реже - 1⁄6). Вообще говоря, её ширина зависит от языка набора и производителя шрифта, и в кириллических шрифтах тонкая шпация обычно имеет ширину в 1⁄5 круглой. Эта шпация по пропорциям в точности соответствует двухпунктовой шпации при наборе кеглем в 10 пунктов. По-английски называется Thin Space.
- Волосяная шпация , U+200A, - самая узкая шпация, шириной около 1⁄10-1⁄16 круглой. Такая шпация по пропорциям примерно соответствует однопунктовой шпации при наборе кеглем в 10 пунктов или выглядит даже у́же.
Использование различных пробелов
Поскольку ширина межсловного пробела фиксирована в шрифте и изменяется автоматически при выключке по ширине, использование других пробельных символов в качестве межсловных оправдано только при наборе печатных изданий, и только при наличии глубокого понимания, для чего это делается.В обычной вёрстке для веба для разделения слов достаточно пользоваться обычными и неразрывными межсловными пробелами.
Вместе тем, по правилам русскоязычной типографики в ряде мест должна использоваться тонкая шпация (точнее, в справочниках написано о двухпунктовой шпации, но мы будем употреблять термин «тонкая шпация» как наиболее соответствующий и с точки зрения устоявшейся терминологии, и с точки зрения внешнего вида строки при наборе).
Основные правила использования пробелов будут описаны ниже, но в целом мы рекомендуем следующий принцип для использования при вёрстке для веба.
При подготовке документов в формате HTML для публикации в Интернете в качестве пробельных элементов должны использоваться только пробел, неразрывный пробел и тонкая шпация. В том случае, если автор предполагает, что страница должна просматриваться с помощью агентов, некорректно обрабатывающих символ, то вместо тонкой шпации должен использоваться обычный или неразрывный пробел.
Использование только тонкой шпации из всего разнообразия пробельных элементов позволяет, во-первых, сохранить гармоничный вид набранного текста, а во-вторых, не перегружать автора публикации разнообразными правилами употребления шпаций различной дробной ширины.
Обработка пробелов браузерами и поисковиками
При подготовке материала статьи мы провели своеобразный эксперимент на специально подготовленной странице. Яндекс и Google справляются с нестандартными символами хорошо, заменяя при поиске все нестандартные пробельные элементы на обычные (мы считаем, что это - правильное поведение). То есть, они не делают разницы между текстами «два слова», «два слова», «два слова» и т. п.Как выяснилось, рендеринг нестандартных пробельных элементов работает в браузерах из рук вон плохо. Нормально справляются с задачей только Firefox 3.0 в Windows XP и *nix, MSIE 7.0 и Safari в Windows XP. Об MSIE 8.0 данных нет, но скорее всего, у него тоже всё в порядке.
- Firefox до версии 3.0 вообще не разрывает строку в местах нестандартных пробелов. При этом ширина пробелов отображается правильно.
- Opera 9.26 и 9.50, FireFox 3.0 под Mac, Safari под Mac строку переносят, но зато все пробелы оказываются одной ширины.
- MSIE 5.5 и 6.0 под Windows 2000 вместо пробелов ставят квадратики (возможно, соответствующие символы просто отсутствуют в системном шрифте).
Основные правила употребления пробелов
Итак, ещё раз подчеркнём, что во всех правилах, перечисленных ниже, тонкая шпация используется только в том случае, когда автор отметает риск использования посетителем сайта браузеров, неверно отображающих тонкую шпацию. К ним относятся некоторые браузеры в *nix (возможно, это связано со встроенными шрифтами), MSIE версии 6.0 и раньше, браузеры для Mac (ими можно пренебречь, так как ошибка рендеринга заключается только в ширине шпации), возможно - некоторые браузеры для мобильных телефонов и КПК.В том случае, если использование таких браузеров вероятно, мы рекомендуем использовать вместо тонкой шпации обычный или неразрывный межсловный пробелы.
Как было описано выше, согласно рекомендациям Unicode тонкая шпация является таким пробелом, где возможен разрыв строки. В тех случаях, когда правила требуют постановки тонкой шпации и запрета разрыва строки (например, между разрядами при наборе числа), необходимо использовать конструкцию типа 250 000 . HTML-элемент nobr является проприетарным и к использованию запрещён.
Далее мы опишем те правила расстановки пробелов, которые чаще всего, по нашим наблюдениям, нарушаются при вёрстке текстов. Более подробную информацию о правилах набора текстов можно почерпнуть, например, в «Справочнике издателя и автора» А. Э. Мильчина и Л. К. Чельцовой.
Сокращения и символы
- В сокращениях «и так далее», «и тому подобное», «так как», «то есть», «и другие», «до нашей эры», «южной широты» и подобных все элементы сокращения отделяются неразрывным пробелом.
и т. д. - и т. д.
и т. п. - и т. п.
т. к. - т. к.
т. е. - т. е.
и др. - и др.
до н. э. - до н. э.
ю. ш. - ю. ш. - Инициалы отбиваются друг от друга и от фамилии неразрывным пробелом.
А. С. Пушкин - А. С. Пушкин
Дж. Р. Р. Толкиен - Дж. Р. Р. Толкиен
Допустима также отбивка инициалов друг от друга и от следующей за ним фамилии тонкой шпацией, однако перенос инициалов либо фамилии на следующую строку запрещён. Независимо от выбора стиля отбивки инициалов необходимо придерживаться единства стиля в рамках всего документа или сайта.
В. В. Путин - В. В. Путин
В. Путин - В. Путин
Путин В. В. - Путин В. В.
Путин В. - Путин В. - Сокращённое слово отбивается от имени собственного неразрывным пробелом.
ул. Щорса - ул. Щорса
г. Москва - г. Москва
метрополитен им. Ленина - метрополитен им. Ленина - Число и соответствующее ему счётное слово отбиваются неразрывным пробелом.
12 млрд рублей - 12 млрд рублей
гл. IV - гл. IV
пп. 3-6 - пп. 3-6
рис. 42 - рис. 42
XX в. - XX в.
1941-1945 гг. - 1941-1945 гг.
палата № 6 - палата № 6
§ 22 - § 22
25 % - 25 %
97,5 ? - 97,5 ?
16 ¢ - 16 ¢ . - Число и соответствующая ему единица измерения (кроме знаков градуса, минуты и секунды) отбиваются тонкой шпацией, разрыв строки запрещён.
400 м - 400 м
100 т - 100 т
451 °F - 451 °F
но 59°, 57′, 00″. - Знаки градуса, минуты и секунды отбиваются тонкой шпацией от последующих цифр.
59° 57′ 00″ - 59° 57′ 00″
Числа и интервалы
- Дробная и целая части числа не отбиваются пробелом от запятой: 0,62 , 345,5 .
- Разряды числа отбиваются друг от друга тонкой шпацией, кроме дат, номеров (например, документов), обозначений машин и механизмов.
25 563,42 - 25 563,42
1 652 - 1 652
1 298 300 - 1 298 300
но 1999 год , ГОСТ 20283 , вх. № 982364 - При численном обозначении интервалов тире не отбивается от границ интервала.
50-100 м - 50-100 м
1 500-2 000 - 1 500-2 000
1,5-2 тыс. - 1,5-2 тыс.
15-20 % - 15-20 % - Унарные знаки плюс, минус и плюс-минус не отбиваются от следующего за ним числа: +20 °C , −42 , ±0,1 .
- Бинарные знаки математических операций и соотношений отбиваются с обеих сторон на тонкую шпацию.
2 + 3 = 5 - 2 + 3 = 5
Знаки препинания
- Точка, запятая, двоеточие, вопросительный и восклицательный знаки, точка с запятой не отбиваются пробелом от предшествующего слова, и отбиваются пробелом от последующего: Ха, ха. Ха? Ха!
- Многоточие не отбивается от предшествующего слова, если оно стоит в конце предложения или части предложения, и от последующего - если оно стоит в начале предложения: Ого… Что? …Ничего.
- Кавычки не отбиваются пробелами от заключённого в них текста: броненосец «Потёмкин» .
- Скобки не отбиваются пробелами от заключённого в них текста, и отбиваются пробелами снаружи (кроме того случая, когда закрывающая скобка соседствует с знаком препинания справа): Текст в скобках никому не интересен (обычно).
- Тире отбивается от предыдущего слова неразрывным пробелом, а от следующего - обычным пробелом (в том числе и в случае, если интервал указан в словесной, а не цифровой форме).
Витенька - молодец!
нам подойдёт только огурец длиной пятнадцать - двадцать сантиметров
пакт Молотова - Риббентропа . - Если два числа в словесной форме не образуют интервал, а означают «то ли одно число, то ли другое», то между ними ставится дефис, который не отбивается пробелами: выпил рюмки две-три .
Нежелательные переносы
- Короткие слова и союзы (а , и , но , я , ты , и так далее) лучше отбивать от последующего слова неразрывным пробелом, так как висящее на конце строки короткое слово ухудшает читаемость. В том числе очень желательно не допускать переноса строки между частицей не и следующим за ней глаголом.
- Частицы же , бы , ли желательно отбивать от предыдущего слова неразрывным пробелом: то же , сказал бы , думал ли я .
- Желательно не отрывать предлоги в начале предложения от следующих за ними слов. (даже более длинные, чем одно- и двухбуквенные)
Инструмент считает количество символов, знаков и слов в тексте онлайн. Подсчет символов может производиться как в обычном тексте, так и с HTML-тегами. В результатах отображается количество знаков с пробелами, без пробелов и количество слов. Инструмент также содержит очень удобную функцию расчета стоимости текста.
Количество символов онлайн
Внимание! JavaScript отключен.
Без включенной поддержки JavaScript функция Количество символов
работать не будет
.
Включите в своём браузере поддержку JavaScript и обновите страницу.
- Количество символов
- Всего символов:
- Знаков без пробелов (збп):
- Количество слов:
- Знаков препинания:
- Дополнительные свойства
- Исходный размер текста:
- Количество пробелов:
- Лишние пробелы:
- Переводов строк:
- Расчет стоимости контента
- Стоимость:
- 0.00 руб. (0 символов)
- Стоимость:
- 0.00 руб. (0 знаков без пробелов)
Ниже приведены описания всех полей и значений, которые используются при подсчете символов и знаков в тексте. Также указано как считается каждое такое значение.
Всего символов
Производится подсчет всех символов в тексте. Учитывается и считается всё - буквы, цифры, знаки препинания, а также пробелы. Отображается общее количество символов в тексте.
Количество знаков без пробелов (збп)
Производится подсчет всех символов и знаков в тексте, за исключением только пробелов. Все пробелы исключаются из подсчета и не учитываются в данном результате. Данное значение очень часто используется при расчете или указании стоимости статей за 1000 знаков без пробелов (збп).
Количество слов
Считаются и отображаются все найденные слова в тексте.
Знаки препинания
Отдельно считаются знаки препинания. Подсчет производится наиболее распространенных знаков препинания. , : ; ! ? … , слэш \ | / ⁄ , скобки () {} ⟨⟩ , тире - ‒ – - ― , кавычки " " ` „ “ « » “ ” ‘ ’ .
Ниже представлено описание всех дополнительных свойств текста, таких как исходный размер текста, сколько в тексте пробелов и лишние пробелы. Рассказано как считаются все эти значения.
Исходный размер текста
Исходный размер текста содержит длину необработанного текста, в котором могут содержаться служебные символы, такие как "табуляция", "перевод строки", "возврат каретки" и другие символы, которые не должны учитываться в подсчете текста. Веб-браузеры не отображают такие символы, их не видно на странице сайта.
Количество пробелов
Подсчет всех пробелов в тексте, суммируется количество всех найденных пробелов и полученное значение отображается в данном поле.
Лишние пробелы
Лишние пробелы - это задвоенные пробелы, стоящие друг за другом, количество которых может быть два и более. Все такие пробелы считаются лишними, они не должны присутствовать в тексте. К лишним пробелам также относятся пробелы, присутствующие перед или после абзаца, а также на пустых строках.
Считать HTML-теги
Дополнительная опция. По умолчанию, если текст содержит HTML-теги, то они игнорируются и не учитываются при подсчете текста, таким образом получается подсчет символов чистого текста, без HTML-тегов. Данная опция очень полезна, используйте её, если необходимо произвести подсчет текста, включая html-разметку.
Расчет стоимости контента
Данная функция будет интересна и полезна многим журналистам, копирайтерам и рерайтерам, которые пишут статьи и тексты на заказ. Данная функция позволяет рассчитать стоимость текста, укажите стоимость за 1000 символов и введите валюту. Данные автоматически считаются и сразу отображаются, что позволяет моментально видеть сумму стоимости всего текста или статьи.
Считаются ли знаки препинания при подсчете символов?
Да, считаются. Точки, запятые, тире, восклицательные, вопросительные и другие знаки считаются при подсчете символов в тексте. Предположим вам необходимо добавить сайт в каталог придумав заголовок длинной всего 80 символов, и если в данном заголовке будут присутствовать знаки препинания, то они тоже будут считаться за символы. Пробел тоже относится к знакам препинания и тоже считается.
Копирайтеры в большинстве случаев указывают стоимость текста за количество знаков без пробелов (збп) в пользу заказчика, но все остальные знаки считаются и учитываются. Остальные знаки не исключают потому, что их количество незначительно влияет на итоговую стоимость текста.
Как следует из заголовка, речь в статье пойдёт о неотъемлемой части любого русскоязычного (и не только) текста - о пробеле. Мы затронем историю пробела, виды пробелов, вопросы употребления пробела в веб-типографике.
Вообще говоря, пробел - это любое пустое место в рукописном, печатном или отображаемом на любом другом носителе тексте. Так что пробелы бывают разные:
- спусковые (большие вертикальные пропуски в первой полосе издания) и концевые пробелы полосы,
- абзацные отступы и концевые пробелы абзаца,
- межстрочные пробелы (между строками текста),
- межсловные пробелы (между словами в одной строке),
- межбуквенные пробелы (между буквами в слове).
История межсловного пробела
Межсловный пробел - сравнительно позднее изобретении в истории человеческой мысли. Глубоко история пробела изложена в книге Пола Санджера (Paul Saenger) «Space between Words: The Origins of Silent Reading», а также, несколько менее глубоко, в книге Иоганнеса Фридриха «История письма».Также есть неплохая статья Антона Бизяева о пробелах и об их истории «В начале пробелов не было» , которая была опубликована в 1997 году в журнале «Publish».
Вкратце, пробел появился достаточно поздно, в тех письменностях, где отсутствие разграничения слов приводило к сложности чтения (так называемое консонантное письмо, где записываются только согласные звуки). Однако в греческом и латыни, в которых записывали и гласные звуки, использование пробела было утеряно. Пол Санджер связывает это с тем, что чтение производилось вслух, что упрощало разграничение слов при восприятии текста.
Вновь пробел начал использоваться приблизительно в VII-IX вв. н. э., и эта традиция пришла из Ирландии, где у писцов и чтецов родным языком являлся древнеирландский, а религиозная литература записывалась на латыни. По-видимому, по этой причине монахи испытывали трудности с чтением вслух. Считается, что появление пробела плотно связано с постепенным переходом от чтения вслух к чтению про себя. Примерами книг на латыни с межсловными пробелами являются памятники британской литературы: Евангелие из Дарроу (VII в.) и Келлская книга (VIII-IX вв.).
В глаголице и кириллице пробел также отсутствовал, и в привычном нам смысле используется только с XVII века.
До того, как человечество изобрело наборный шрифт, никакой особенной классификации межсловных пробелов не было - ставили писцы пробелы на глазок и ставили. Напомню (мы писали об этом в статье ), что рукопись и ксиллография относятся к способам создания текстов без подвижности литер. Естественно, пробелы могли получаться различной ширины, так как пропуски делались вручную.
Пробелы в ручном наборе
Когда подвижность литер появилась (а произошло это с появлением наборных шрифтов), появились соответственно и вопросы - а как же ставить пробелы, чтобы соблюдалась выключка по ширине?Технология ручного набора такова, что набранная строка полностью зажимается в верстатке и в гранке, и, соответственно, должна иметь ширину, практически точно равную ширине полосы (подробнее с технологией ручного набора можно познакомиться в одноимённой книге М. В. Шульмейстера).
Строка при ручном наборе набиралась из литер (брусков, на торце которых делались выпуклые зеркальные копии букв, отпечатывающиеся на бумаге), а межсловные пробелы создавались с помощью так называемых шпаций - брусков различной толщины, у которых на торце нет печатающей поверхности. Выглядит это примерно вот так . Шпации для каждого кегля шрифта, естественно, выпускались свои, и имели различную ширину. Например, для шрифта кегля 10 пунктов (стандартный кегль для большинства текстовых изданий) выпускались шпации шириной 10, 5, 4, 3, 2 и 1 пункт.
Шпации шириной в кегль назывались кегельными или круглыми. Шпации в половину кегельной назывались полукегельными или полукруглыми. Также существует название «тонкая шпация», под которой понимают шпации толщиной 1-2 пункта для шрифта кегля 8-12 пунктов. То есть, для шрифта кегля 10 пунктов тонкая шпация обычно составляет 2 пункта (соответственно, 1⁄5 кегельной). Однако, в связи с отсутствием точного определения тонкой шпации, в руководствах издателя, редактора и верстальщика обычно говорят не об отбивке на тонкую шпацию, а об отбивке на столько-то пунктов (считая, что кегль шрифта равен 10 пунктам).
Таким образом, нужно понимать, что в зависимости от кегля шрифта доля круглой шпации (треть, четверть и т. п.) может иметь разную ширину в пунктах, и наоборот.
Традиционная ширина межсловного пробела
Итак, разобравшись с тем, что такое круглая и полукруглая шпации, перейдём к принятой в российском наборе ширине собственно межсловного пробела.Шульмейстер пишет (стр. 94), что при наборе строки между словами ставится полукруглая. Когда строка набрана до конца, в большинстве случаев её ширина оказывается либо меньше, либо больше ширины полосы набора. Поэтому верстальщику приходится изменять ширину пробелов, уменьшая её минимум до 1⁄4 круглой и увеличивая максимум до 3⁄4 круглой (соответственно, при наборе кеглем 10 пунктов межсловные пробелы могут варьироваться от 3 до 7 пунктов). Естественно, бывают нюансы, зависящие от формата издания, но мы их касаться не будем.
Однако, Шульмейстер оговаривается, что сам по себе межсловный пробел в полукруглую великоват, и использование стандартного пробела в 1⁄3 круглой является как более экономичным с точки зрения расхода бумаги, так зачастую и более красивым. Также использование межсловного пробела в полукруглую не рекомендуется для узких шрифтов.
С появлением строкоотливных машин пробелы стали делаться равномерными по ширине в пределах одной строки, а ширина межсловного пробела стала варьироваться около 1⁄3 круглой.
Компьютерный набор и веб-типографика
В настоящее время мы ограничены возможностями используемых шрифтов, и, естественно, набором символов в Unicode. Нужно помнить, что далеко не все шрифты содержат большинство пробельных Unicode-символов.При переходе к компьютерным системам вёрстки был совершён переход от указания ширины шпаций в пунктах к указанию ширины шпаций в долях круглой, так как шрифты стали легко масштабироваться до любого кегля, а пробельные элементы должны были оставаться пропорциональными кеглю шрифта.
Символы пробела в Unicode
В Unicode предусмотрены следующие символы для пробелов западной типографики.- Межсловный пробел , U+0020, - ширина от 1⁄5 до 1⁄2 круглой в зависимости от шрифта. Для средних шрифтов межсловный пробел имеет ширину порядка 1⁄4 круглой (например, Times New Roman имеет именно такой пробел), для широких - порядка 1⁄3 круглой (Microsoft Verdana - 0,35 круглой, Microsoft Tahoma - 0,31 круглой).
- Неразрывный межсловный пробел , U+00A0, - имеет ту же ширину, что и обычный межсловный пробел, но в месте неразрывного пробела запрещён разрыв строки.
Все остальные пробельные символы имеют фиксированную ширину и не растягиваются при выключке строк по ширине. Вместе с тем, согласно алгоритму разрыва строк в Unicode , все они должны обрабатываться как точка разрыва строки.
- Круглая шпация , U+2003, - как было сказано, имеет ширину, равную размеру кегля. Также называется Em Space, возможно, потому что буква «M» в каких-либо старых шрифтах имела такую ширину. Вместе с тем, сейчас это выполняется далеко не везде, и поэтому утверждение, что Em Space всегда имеет ширину буквы «M» - заблуждение.
- Полукруглая шпация , U+2002, - половина круглой. Также называется En Space, возможно, потому что буква «N» в каких-либо старых шрифтах имела такую ширину. Вместе с тем, сейчас это выполняется далеко не везде, и поэтому утверждение, что En Space всегда имеет ширину буквы «N» - заблуждение.
- Третная шпация , U+2004, - треть круглой. По-английски называется Three-per-Em Space.
- Четвертная шпация , U+2005, - четверть круглой. По-английски называется Four-per-Em Space.
- Одна шестая круглой , U+2006, . По-английски называется Six-per-Em Space.
- Тонкая шпация , U+2009, - обычно имеет ширину в 1⁄5 круглой (реже - 1⁄6). Вообще говоря, её ширина зависит от языка набора и производителя шрифта, и в кириллических шрифтах тонкая шпация обычно имеет ширину в 1⁄5 круглой. Эта шпация по пропорциям в точности соответствует двухпунктовой шпации при наборе кеглем в 10 пунктов. По-английски называется Thin Space.
- Волосяная шпация , U+200A, - самая узкая шпация, шириной около 1⁄10-1⁄16 круглой. Такая шпация по пропорциям примерно соответствует однопунктовой шпации при наборе кеглем в 10 пунктов или выглядит даже у́же.
Использование различных пробелов
Поскольку ширина межсловного пробела фиксирована в шрифте и изменяется автоматически при выключке по ширине, использование других пробельных символов в качестве межсловных оправдано только при наборе печатных изданий, и только при наличии глубокого понимания, для чего это делается.В обычной вёрстке для веба для разделения слов достаточно пользоваться обычными и неразрывными межсловными пробелами.
Вместе тем, по правилам русскоязычной типографики в ряде мест должна использоваться тонкая шпация (точнее, в справочниках написано о двухпунктовой шпации, но мы будем употреблять термин «тонкая шпация» как наиболее соответствующий и с точки зрения устоявшейся терминологии, и с точки зрения внешнего вида строки при наборе).
Основные правила использования пробелов будут описаны ниже, но в целом мы рекомендуем следующий принцип для использования при вёрстке для веба.
При подготовке документов в формате HTML для публикации в Интернете в качестве пробельных элементов должны использоваться только пробел, неразрывный пробел и тонкая шпация. В том случае, если автор предполагает, что страница должна просматриваться с помощью агентов, некорректно обрабатывающих символ, то вместо тонкой шпации должен использоваться обычный или неразрывный пробел.
Использование только тонкой шпации из всего разнообразия пробельных элементов позволяет, во-первых, сохранить гармоничный вид набранного текста, а во-вторых, не перегружать автора публикации разнообразными правилами употребления шпаций различной дробной ширины.
Обработка пробелов браузерами и поисковиками
При подготовке материала статьи мы провели своеобразный эксперимент на специально подготовленной странице. Яндекс и Google справляются с нестандартными символами хорошо, заменяя при поиске все нестандартные пробельные элементы на обычные (мы считаем, что это - правильное поведение). То есть, они не делают разницы между текстами «два слова», «два слова», «два слова» и т. п.Как выяснилось, рендеринг нестандартных пробельных элементов работает в браузерах из рук вон плохо. Нормально справляются с задачей только Firefox 3.0 в Windows XP и *nix, MSIE 7.0 и Safari в Windows XP. Об MSIE 8.0 данных нет, но скорее всего, у него тоже всё в порядке.
- Firefox до версии 3.0 вообще не разрывает строку в местах нестандартных пробелов. При этом ширина пробелов отображается правильно.
- Opera 9.26 и 9.50, FireFox 3.0 под Mac, Safari под Mac строку переносят, но зато все пробелы оказываются одной ширины.
- MSIE 5.5 и 6.0 под Windows 2000 вместо пробелов ставят квадратики (возможно, соответствующие символы просто отсутствуют в системном шрифте).
Основные правила употребления пробелов
Итак, ещё раз подчеркнём, что во всех правилах, перечисленных ниже, тонкая шпация используется только в том случае, когда автор отметает риск использования посетителем сайта браузеров, неверно отображающих тонкую шпацию. К ним относятся некоторые браузеры в *nix (возможно, это связано со встроенными шрифтами), MSIE версии 6.0 и раньше, браузеры для Mac (ими можно пренебречь, так как ошибка рендеринга заключается только в ширине шпации), возможно - некоторые браузеры для мобильных телефонов и КПК.В том случае, если использование таких браузеров вероятно, мы рекомендуем использовать вместо тонкой шпации обычный или неразрывный межсловный пробелы.
Как было описано выше, согласно рекомендациям Unicode тонкая шпация является таким пробелом, где возможен разрыв строки. В тех случаях, когда правила требуют постановки тонкой шпации и запрета разрыва строки (например, между разрядами при наборе числа), необходимо использовать конструкцию типа 250 000 . HTML-элемент nobr является проприетарным и к использованию запрещён.
Далее мы опишем те правила расстановки пробелов, которые чаще всего, по нашим наблюдениям, нарушаются при вёрстке текстов. Более подробную информацию о правилах набора текстов можно почерпнуть, например, в «Справочнике издателя и автора» А. Э. Мильчина и Л. К. Чельцовой.
Сокращения и символы
- В сокращениях «и так далее», «и тому подобное», «так как», «то есть», «и другие», «до нашей эры», «южной широты» и подобных все элементы сокращения отделяются неразрывным пробелом.
и т. д. - и т. д.
и т. п. - и т. п.
т. к. - т. к.
т. е. - т. е.
и др. - и др.
до н. э. - до н. э.
ю. ш. - ю. ш. - Инициалы отбиваются друг от друга и от фамилии неразрывным пробелом.
А. С. Пушкин - А. С. Пушкин
Дж. Р. Р. Толкиен - Дж. Р. Р. Толкиен
Допустима также отбивка инициалов друг от друга и от следующей за ним фамилии тонкой шпацией, однако перенос инициалов либо фамилии на следующую строку запрещён. Независимо от выбора стиля отбивки инициалов необходимо придерживаться единства стиля в рамках всего документа или сайта.
В. В. Путин - В. В. Путин
В. Путин - В. Путин
Путин В. В. - Путин В. В.
Путин В. - Путин В. - Сокращённое слово отбивается от имени собственного неразрывным пробелом.
ул. Щорса - ул. Щорса
г. Москва - г. Москва
метрополитен им. Ленина - метрополитен им. Ленина - Число и соответствующее ему счётное слово отбиваются неразрывным пробелом.
12 млрд рублей - 12 млрд рублей
гл. IV - гл. IV
пп. 3-6 - пп. 3-6
рис. 42 - рис. 42
XX в. - XX в.
1941-1945 гг. - 1941-1945 гг.
палата № 6 - палата № 6
§ 22 - § 22
25 % - 25 %
97,5 ? - 97,5 ?
16 ¢ - 16 ¢ . - Число и соответствующая ему единица измерения (кроме знаков градуса, минуты и секунды) отбиваются тонкой шпацией, разрыв строки запрещён.
400 м - 400 м
100 т - 100 т
451 °F - 451 °F
но 59°, 57′, 00″. - Знаки градуса, минуты и секунды отбиваются тонкой шпацией от последующих цифр.
59° 57′ 00″ - 59° 57′ 00″
Числа и интервалы
- Дробная и целая части числа не отбиваются пробелом от запятой: 0,62 , 345,5 .
- Разряды числа отбиваются друг от друга тонкой шпацией, кроме дат, номеров (например, документов), обозначений машин и механизмов.
25 563,42 - 25 563,42
1 652 - 1 652
1 298 300 - 1 298 300
но 1999 год , ГОСТ 20283 , вх. № 982364 - При численном обозначении интервалов тире не отбивается от границ интервала.
50-100 м - 50-100 м
1 500-2 000 - 1 500-2 000
1,5-2 тыс. - 1,5-2 тыс.
15-20 % - 15-20 % - Унарные знаки плюс, минус и плюс-минус не отбиваются от следующего за ним числа: +20 °C , −42 , ±0,1 .
- Бинарные знаки математических операций и соотношений отбиваются с обеих сторон на тонкую шпацию.
2 + 3 = 5 - 2 + 3 = 5
Знаки препинания
- Точка, запятая, двоеточие, вопросительный и восклицательный знаки, точка с запятой не отбиваются пробелом от предшествующего слова, и отбиваются пробелом от последующего: Ха, ха. Ха? Ха!
- Многоточие не отбивается от предшествующего слова, если оно стоит в конце предложения или части предложения, и от последующего - если оно стоит в начале предложения: Ого… Что? …Ничего.
- Кавычки не отбиваются пробелами от заключённого в них текста: броненосец «Потёмкин» .
- Скобки не отбиваются пробелами от заключённого в них текста, и отбиваются пробелами снаружи (кроме того случая, когда закрывающая скобка соседствует с знаком препинания справа): Текст в скобках никому не интересен (обычно).
- Тире отбивается от предыдущего слова неразрывным пробелом, а от следующего - обычным пробелом (в том числе и в случае, если интервал указан в словесной, а не цифровой форме).
Витенька - молодец!
нам подойдёт только огурец длиной пятнадцать - двадцать сантиметров
пакт Молотова - Риббентропа . - Если два числа в словесной форме не образуют интервал, а означают «то ли одно число, то ли другое», то между ними ставится дефис, который не отбивается пробелами: выпил рюмки две-три .
Нежелательные переносы
- Короткие слова и союзы (а , и , но , я , ты , и так далее) лучше отбивать от последующего слова неразрывным пробелом, так как висящее на конце строки короткое слово ухудшает читаемость. В том числе очень желательно не допускать переноса строки между частицей не и следующим за ней глаголом.
- Частицы же , бы , ли желательно отбивать от предыдущего слова неразрывным пробелом: то же , сказал бы , думал ли я .
- Желательно не отрывать предлоги в начале предложения от следующих за ними слов. (даже более длинные, чем одно- и двухбуквенные)