Обсуждение Википедии:Русские ударения
Материал из Википедии — свободной энциклопедии
[править] Суть проблемы
|
Актуальные |
Архивные
|
В наиболее уважаемых русскоязычных энциклопедиях и словарях принято давать заголовок словарной статьи с расставленными ударениями, чтобы избежать путаницы в произношении. Википедия также стремится стать уважаемой энциклопедией, и во многих статьях ударения расставлены аналогичным образом.
Однако у интернет-проектов есть своя специфика: в результате ошибок и небрежностей программистов и разработчиков шрифтов возникают ситуации, когда один и тот же текст по-разному отображается в разных программах, операционных системах и т. п.
Итак, существует ряд программ и шрифтов, которые не вполне соответствуют существующим стандартам представления html-документов. Одной из проблем таких программ и шрифтов является нетрадиционный порядок записи комбинируемых символов. В том числе это относится и к ударениям.
В частности, широко распространённый Юникод-шрифт Verdana (который используется в том числе и в скине "Кёльнская тоска" Википедии), в отличие от большинства других, предполагает такой порядок записи комбинируемых символов:
<диакритический знак><буква>
Таким образом, статьи, размеченные согласно стандарту Юникода (<буква><диакритический знак>), отображаются в шрифте Verdana неправильно. Аналогичные трудности возникают и в некоторых браузер-шрифтовых комбинациях в Linux и, возможно, других операционных системах.
Использование ударений и других диакритических знаков, как и буквы "ё", в принципе может негативно сказаться на возможности поиска в Википедии и в интернете вообще. Всё же, поскольку ударения в русской Википедии расставляются только внутри статьи и только в первом упоминании термина, вынесенного в заголовок статьи, их употребление практически не отражается на количестве и качестве результатов поиска: в первую очередь поиск идет по названию статьи, в котором ударения нет.
[править] Тезисы обсуждения
[править] Обсуждение
Хотелось бы вновь вернуться к теме о русских ударениях, ужé обсуждавшейся осенью 2004 года здесь, в форуме. Тогда, как я вижу, Monedula отстаивал идею об использовании ́
, а не á
, а BACbKA упомянул, что его Firefox 0.8 показывает эти ударения не над предыдущим символом, как следовало бы, а над последующим.
Со своей стороны могу заметить, по результатам вон той беседы, что положение ударений, задаваемых при помощи ́
(или ´
, что почти то же самое), существенно зависит от используемого шрифта: так, в шрифте Verdana символы ударения надобно ставить перед ударными гласными, а во многих других шрифтах — после ударных гласных.
Это обстоятельство способно привести (и будет приводить) к проблемам в следующих возможных случаях:
- Читатель Википедии использует для чтения совсем не тот шрифт, который использовался автором (или редактором) читаемой статьи. (Простой пример — читатели с проблемами восприятия, вынужденные перенастраивать стиль отображения, чтобы он соответствовал их потребностям.)
- Читатель Википедии, пользуясь лицензией GNU FDL, бездумно копирует фрагменты текста статьи (статей) Википедии в такое место (сайт) в Паутине, где используется другой шрифт. (Например, цитирование в блогосфере.)
- Сетевик ищет информацию в такой поисковой системе, где используется другой шрифт либо в поле поиска, либо при выдаче результатов поиска, либо в обоих случаях.
Во всех этих случаях использование кода ́
приводит к проблемам, которые автор (или редактор) статей Википедии может не предвидеть — и, более того, не мог бы предотвратить, даже предвидя их.
Следуя этим соображениям, я рекомендую википедистам использовать не отдельные ударения, а буквы, совмещённые с ударениями: é
для é, ý
для ý, ó
для ó, á
для á. (Все буквы в этих кодах — латинские.)
Проблемы с поиском, вообще характерные для ударных слов, сохранятся, конечно. Но зато внешний вид слов существенно улучшится по сравнению с их ́
-вариантом — и, главное, будет защищён, даже при изменении шрифта, от изменения до обескураживающей неузнаваемости…
(Улучшится потому, что такое ударение плотнее и точнее позиционируется по горизонтали и вертикали относительно основной части символа.)
К сожалению, этот метод неприемлем для других ударных гласных («ы», «э», «я», «ю»); а для ударной "и" замена на ú
более-менее допустима только в курсúвном начертанuu, и притом требует в том же курсиве обязательную замену безударных "и" также на "u", чтобы текст не потерял стилистическое единство. (А также, быть может, и "п" на "n"?) Очевидно, что такая замена означает дальнейший проигрыш в отношении поисковой находимости слов, содержащихся в курсивном отрывке.
Но всё же лучше бывает пожертвовать находимостью, нежели читаемостью.
Вопрос спорный, конечно. Хочу услышать ваши мнения по этому поводу. —Mithgol the Webmaster 21:40, 11 сентября 2005 (UTC)
- Нет, нельзя использовать латинские буквы с acute вместо русских. Проблемы с браузерами всё равно решатся (хотя я их честно говоря и не видел), а энциклопедию мы создаём не на год или два, нам важнее как правильно. Вообще, если честно, я ударения в статьях не ставлю мне кажется ни к чему они, но если кому-то они нравятся, то пускай, хуже не будет. MaxiMaxiMax 22:31, 11 сентября 2005 (UTC)
-
- Соображение о долгосрочном планировании, действительно, надо принять во внимание. Спасибо за напоминание. Я, впрочем, полагаю, что мы могли бы выработать компромиссное решение на период технологического безвременья, чтобы сейчас ударения ставились по-визуальному, а после исчезновения вышеупомянутых проблем (кстати, главная проблема не в браузерах, а в шрифтах) ударения автоматически начали бы ставиться по-правильному. Достаточно создать пять штук шаблонов, состоящих из одной буквы каждый, а в дальнейшем, когда явится нужда, переменить их. —Mithgol the Webmaster 23:32, 11 сентября 2005 (UTC)
-
- Не так важно, что думают об этом отдельные шрифты или операционные системы — это их проблемы. Если есть стандартный способ отображения диакритик, надо им пользоваться, можт быть это подвинет авторов глючного ПО на исправления :)
- Согласен с MMM, патинские буквы с акцентами это хуже чем не решение, поскольку теряется информация об оригинальных буквах. ==Maxim Razin(talk) 22:50, 11 сентября 2005 (UTC)
-
-
- Шутка хорошая :-) Предлагаю, однако ж, трезво оценивать возможности Википедии по психологическому давлению на производителей шрифтов… (Та же «Вердана», насколько помню, производится Корпорацией Майкрософт.) Потерь же информации о первоначальных буквах может и не быть: мне только что пришла в голову мысль о шаблонах (см. чуть выше). —Mithgol the Webmaster 23:32, 11 сентября 2005 (UTC)
-
-
-
-
- Пожалуйста, не надо сюда своих демагогий. Ещё раз тебе повторяю, википедия - не место для самоутверждения. Есть стандартный способ простановки ударений, если их нет в каком-либо шрифте, то это проблемы только такого шрифта и тех пользователей, кто таким шрифтом пользуется. --Влад Ярославлев 05:04, 12 сентября 2005 (UTC)
-
-
-
-
-
-
- Отвлекись от того обстоятельства, что это предложение вношу именно я, и постарайся возражать не мне, а моему мнению. Сейчас ты игнорируешь действительное положение дел: в Вердане ударения есть, но они указывают не на ту букву; в этом проблема. Конечно, это проблема только пользователей Верданы, но они, согласись, не малочисленны. Два с половиной миллиона активно пишущих пользователей LiveJournal.com вынуждены ежедневно видеть комментарии, при предпросмотре, записанными шрифтом Вердана. Зачем же создавать проблемы, если можно обойти их? —Mithgol the Webmaster 19:10, 12 сентября 2005 (UTC)
-
-
-
-
-
-
-
-
- Ещё раз: те, кто пользуются Верданой, - сами себе злобные буратины. Это их личные проблемы. Если они не понимают, что этот шрифт сделан криво и неправильно, не соответствует спецификации Unicode о том, что все combining characters (в том числе и acute accent) должны ставиться после символа, то зачем поощрять использование такого шрифта? --Влад Ярославлев 10:19, 17 сентября 2005 (UTC)
-
-
-
-
- Никаких латинских символов. Есть стандартный способ. Если кому-то неудобно копировать такие тексты куда-нибудь - то это их личные проблемы. Тем более что в блогосфере (в жж) в основном всё равно utf-8. --Влад Ярославлев 05:04, 12 сентября 2005 (UTC)
-
- UTF-8 тут не при чём. Ударение сдвигается, к сожалению, в зависимости не от кодировки, а от шрифта. Вдругорядь скажу: последуй по приведённой гиперссылке, там и пример дан. —Mithgol the Webmaster 19:04, 12 сентября 2005 (UTC)
-
-
- Кстати, я сейчас посмотрел. Может у меня что-то не так? У меня в первом твоём примере ударение стоит над буквой р (ссылка на скриншот). Браузер - Opera. А вот в мозилле всё наоборот (ссылка). Видимо, пользователям Оперы подобное не грозит, она сама всё подправляет как надо. А то, что шрифт этот сделан НЕВЕРНО - и доказывать не нужно.
- Кстати, а не хочешь ли ты предложить подстраиваться под пользователей досовской Арахны? или ещё чего-нибудь античного? --Влад Ярославлев 10:31, 17 сентября 2005 (UTC)
-
Шрифт «Вердана» — глючный в отношении диакритик, его лучше не использовать. См. en:Verdana#Combining characters bug. — Monedula 07:56, 12 сентября 2005 (UTC)
- Между прочим, это основной шрифт в Кёльнской тоске.--Алексей (ACrush) ?!/© 08:10, 12 сентября 2005 (UTC)
Латинские буквы со встроенной диакритикой обнуляют шансы данного слова быть найденным в поисковике. От себя добавлю, что мой Firefox для FreeBSD показывает ударения неправильно в любом шрифте, кроме Arial. Firefox для Windows показывает в любом правильно. Так что это проблема конкретных программ, а не шрифтов. --Alex Kapranoff ⊕ 11:06, 12 сентября 2005 (UTC)
- Можно, я всё-таки усомнюсь в том, что Firefox для Windows показывает в любом правильно? (У меня ведь тоже Firefox...) Попробуй шрифт «Вердана», а затем расскажи о результатах. —Mithgol the Webmaster 19:04, 12 сентября 2005 (UTC)
-
- FYI, Mozilla bug 197469 описывает проблему с отрисовкой диакритических символов в Mozilla и Firefox (а именно -- то, что Mozilla currently does not support combining characters in Unicode.). Shattered 15:27, 26 декабря 2005 (UTC)
- Кстати. А нулевые ли шансы быть найденным в поисковике у того слова, в котором
́
? Если тоже да, то нет повода предпочитать на этом основании один метод ударения — другому. —Mithgol the Webmaster 19:04, 12 сентября 2005 (UTC)
-
Чего в решете воду мутите?поиск-то у нас либо по заголовкам - без ударений, либо полнотекстовый. причем заголовок статьи - стопудово приоритет, а в основном тексте статьи ударения мы не используем, так что там всё найдётся (не сочтите за рекламу). Гораздо менее однозначно выглядит повсеместная Ё-фикация. Мало кто, знаете ли, при составлении поискового запроса вспоминает про эту несчастную полузабытую букву.--Алексей (ACrush) ?!/© 19:16, 12 сентября 2005 (UTC)
-
-
- Если хочешь обсудить необходимость ёфикации, создай отдельный раздел форума, и мы с радостью её обсудим. —Mithgol the Webmaster 04:36, 13 сентября 2005 (UTC)
-
-
-
-
- Я, собственно, о том, что обсуждать проблемы с поиском именно в этой дискуссии бессмысленно. То есть поиск здесь не аргумент. Если кого-то обидело решето - извините. Пытался пошутить.
- Проблемы с Верданой, похоже есть уже далеко не у всех виндов. Вчера и позавчера у меня отказывался работать скин Монокнига, в связи с чем я сменил его на Кёльнскую тоску, которая вся отображается Верданой. И никаких проблем с ударениями. WinXP SP2 + FireFox 1.0.6--Алексей (ACrush) ?!/© 06:24, 13 сентября 2005 (UTC)
-
-
-
-
- «ё» и «е» давно рассматриваются русскими поисковиками как одна буква. Внутренний поиск Википедии не настолько часто работает, чтобы на него можно было полагаться. --Alex Kapranoff ⊕ 12:03, 13 сентября 2005 (UTC)
-
- Повод предпочитать есть :) Поисковики должны игнорировать 769-ый символ. Приравнять все диакритические варианты (хотя бы из Latin1) к кириллическим аналогам очень сложно. --Alex Kapranoff ⊕ 12:03, 13 сентября 2005 (UTC)
Почему-то у меня создалось впечатление (буду рад если я неправ), что некоторые люди с предубеждением относятся к предложению Mithgol the Webmaster только из-за того что эти предложения исходят от него. Хотя, возможно, тут играет роль и то в какой форме он сформулировал свою идею. Тем не менее, никаких шансов на то что мы будем использовать латинские символы с acute вместо русских с ударениями просто нет - так как это приводит к возникновению гораздо большего количества проблем чем помогает в решении существующих - прежде всего потому что в русском языке используется не латиница с какими-либо надстрочными знаками, а кириллица. Совершенно точно так же не стоит на повестке дня и вопроса об использовании буквы "Ё" - мы будем продолжать её так же как и раньше потому что её использование помогает в понимании текста. В общем-то я не вижу никакого смысла в продолжении этой дискуссии, так как оно не принесёт каких-либо изменений, однако хотелось бы обратить внимание некоторых участников на недопустимость личных выпадов, типа "Чего в решете воду мутите?" и "Пожалуйста, не надо сюда своих демагогий". Честно говоря, я удивляюсь такому отношению к новому участнику, который хотел помочь, хотя и заблуждался в том что это будет полезно. MaxiMaxiMax 21:38, 12 сентября 2005 (UTC)
- Я, честно говоря, был и остаюсь вообще против расстановки ударений. Но раз их уже несколько десятков тысяч здесь расставлено, то как-то поздновато менять способ их расстановки. Имхо, всё должно быть единообразно. Если у кого-то будет смещаться ударение на один символ (в большинстве случаев оно тогда будет указывать на согласный звук и будет видно, что оно ошибочно), то это всё же лучше, чем возникновение неразберихи, где часть ударений будет смещаться, а другая часть нет. И наконец, если принять диакрики в качестве ударений, то мы не сможем, как уже было замечено, ставить ударения на буквы «ы», «э», «я», «ю», что совсем не удобно и придётся либо не ставить ударения над этими буквали вообще либо сочетать диакрики с « ́ ». Короче, предлагаю оставить всё как есть, а в хелп (не знаю, правда, в какой именно) написать о возможных проблемах с ударениями, если в настройках стоит шрифт Вердана. P.S. Майкрософт с сервиспаками иногда обновляет шрифты (например так они добавили в шрифты знак евро), поэтому есть надежда, что они рано или поздно пофиксят вердану и всем любителям ударений будет счастье. --Ctac (Стас Козловский) 22:15, 12 сентября 2005 (UTC)
-
- Я за ударения, но только в определении понятия в начале статьи (обычно выделяется жирным шрифтом). Оно действительно помогает тем, для кого русский — не родной, а также молодым читателям (которые, возможно, ещё не знакомы с данным понятием) или тем, кто не уверен в правильном произношении слова. Однако и в заголовках, и в основном тексте, как уже было указано, ударения не используются (и не должны, imho), так что поиск это не затрудняет. P.S.: Мои два евроцента в копилку опыта чтения текстов с ударениями: на работе и дома предпочитаемый брайзер — Firefox. На работе под Windows ударения отображаются правильно, а дома на Маке (читай Free BSD) — после ударных букв. — Oleg326756 07:45, 13 сентября 2005 (UTC)
-
-
- В основном тексте ударения тоже иногда нужны, если разные слова отличаются только ударениями, например: ве́дение — веде́ние, больша́я — бо́льшая. — Monedula 08:03, 13 сентября 2005 (UTC)
-
[править] Итого
Оставляем всё как есть. Проблемы со шрифтами и с программами являются временными, существуют пути их решения - в частности, использовать современные версии программ и шрифтов. Постепенно старые версии перестанут использоваться и всё станет в порядке, да и сейчас практически ни у кого проблем не возникает, так как обычно ударение используется всего в 1-2 словах в статье. При теоретической необходимости использования множества статей в проекте где шрифт Verdana является обязательным всегда можно это преобразование сделать небольшой программой, для написания которой достаточно 5 минут.