New Immissions/Updates:
boundless - educate - edutalab - empatico - es-ebooks - es16 - fr16 - fsfiles - hesperian - solidaria - wikipediaforschools
- wikipediaforschoolses - wikipediaforschoolsfr - wikipediaforschoolspt - worldmap -

See also: Liber Liber - Libro Parlato - Liber Musica  - Manuzio -  Liber Liber ISO Files - Alphabetical Order - Multivolume ZIP Complete Archive - PDF Files - OGG Music Files -

PROJECT GUTENBERG HTML: Volume I - Volume II - Volume III - Volume IV - Volume V - Volume VI - Volume VII - Volume VIII - Volume IX

Ascolta ""Volevo solo fare un audiolibro"" su Spreaker.
CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
Privacy Policy Cookie Policy Terms and Conditions
Википедия:Проект:Работа для бота/Персоналии — Википедия

Википедия:Проект:Работа для бота/Персоналии

Материал из Википедии — свободной энциклопедии

Содержание

[править] Бот о персоналиях

Можно сделать один несложный но полезный бот: Он лезет во все под-категории Персоналий (вплоть до Хренологи Буркина Фасо) и проверяет, отнесены ли они к категории "Персоналии по алфавиту", и если нет - делает это. неон 08:17, 17 августа 2006 (UTC)

Я уже делал такое год назад. Но проблема в том, что в эти категории попадает куча не-персоналий. Вы даже не можете представить себе сколько именно! Поэтому надо составлять список, а потом вручную вычёркивать оттуда лишнее. Это огромная работа. --CodeMonk 20:10, 18 августа 2006 (UTC)

[править] Персоналии по алфавиту

[править] Все статьи-разветвления для персон

Создание статей-разветвлений для статей вида (Ф, И), (Ф, И О), (Ф, И1 И2 И3) и так далее. Описание алгоритма:

Ищем название статьи в категории «Персоналии по алфавиту», выделяем в нём первое слово (тире не считается разделителем слов, так как есть фамилии вида Ф1-Ф2) — Х

Ищем все статьи с совпадающим с Х началом, запоминаем их названия (Y1-Yn), если статья о персоналии, то можно и строчку запомнить****.

Проверяем, есть ли уже статья с именем Х,

если есть и она ((не перенаправление) или (не разветвление-статья)), то в служебную страницу *** дописываем строчку «* [[Х]]:» и на следующих строчках с отступами от начала строки [[Y1]]-[[Yn]] (для проверки позже человеком полноты заполнения статьи-разветвления). Переходим к следующей проверке Х.
если disambig-статья (в тексте есть соответствующее сочетание), то дописываем, в строку, следующую за последней непустой строчкой перед строкой вида "[[Категория:.. или [[:]] или {{..}}, а если её нет, то в последнюю строчку "* [[Y1]]" (****если есть запомненная строка, до дописываем и её) далее до "* [[Yn]]".
в остальных случаях записываем новую статью вида
'''Х''':
* [[Y1]] ****если есть соответствующая запомненная строка, то вписываем её.
* [[Yn]] ****если есть соответствующая запомненная строка, то вписываем её.
{{disambig}}
Дописываем строчку «* [[Х]]» в конец служебной страницы (***Википедия:Проект:Работа для бота/Все статьи-разветвления для персон) для доработки человеком статей бота.

Если в названии проверяемой статьи есть ещё слова, кроме Х, то добавляем к Х следующее слово (часть названия статьи) и повторяем проверку. иначе переходим к новому слову.

**** факультативно, для более полного наполнения строчка выделяется и запоминается с начала статьи, если есть текст вида '''…''', начиная с текста после него и до конца абзаца (вроде как вводное предложение, если не правильно, то человек поправит).

Вероятно, алгоритм можно после дополнительного обдумывания использовать для всех статей, а не только персон. —Дмитрий (DaeX) 08:50, 3 ноября 2005 (UTC)

[править] Все редиректы на персоны

Я думаю, что давно пора что-то делать с фамилиями именами и отчествами, поскольку полную систему редиректов никто не делает. Надо прошерстить категорию Персоналии, поскольку в большинстве случаев структура заглавия статей в этой категории <фамилия>[,][space]<первое имя>[space] <остальные имена>, то боту нетрудно будет сгенерировать редиректы с <имена> <фамилия>; <первое имя> <фамилия>; <фамилия>, <первое имя> и просто <фамилия>. Естественно, перед созданием редиректа проверяется нет ли уже статьи с таким именем, если есть, ссылка заносится в специальный список для ручной проверки, бот больше ничего не делает.--Begemotv2718 05:45, 17 Май 2005 (UTC)

Боту можно поручить собрать список, но его всё равно придётся просматривать вручную. <Первое имя> <фамилия> — не всегда то, что нужно, правильно — <наиболее используемое имя или имена> <фамилия> (Карл Фридрих Гаусс, но не Карл Гаусс), кроме того, проблема с родовыми приставками перед фамилиями (фон Нейман, но Лейбниц — хотя тоже «фон»). Maxim Razin 07:34, 17 Май 2005 (UTC)
И что в этом страшного? Если робот ошибётся просто появится лишний редирект да и всё. --Ctac (Стас Козловский) 19:50, 27 Май 2005 (UTC)
Убедил. Лишние редиректы почти никогда не мешают.Maxim Razin 20:55, 28 Май 2005 (UTC)
Так боты создают статьи-редиректы «Фамилия Имя Отчество», «Фамилия Имя», «Фамилия, Имя», «Имя Фамилия», «Имя Отчество Фамилия», «Фамилия» на статьи вида «Фамилия, Имя Отчество», находящихся в категории «Персоналии» и её подкатегориях? Или нет? Имхо, такой бот был бы ОЧЕНЬ полезен.--Ctac (Стас Козловский) 21:38, 23 июн 2005 (UTC)

Уважаемые господа-ботовладельцы :),

прежде чем запускать боты, посмотрите Википедия:Форум#Запятая после фамилии в названии статьи? и Википедия:Проект:Персоналии#Правила названия статей. Общими усилиями, вроде бы, пришли к решению следовать правилам названия статей указанных в последней ссылке. Там обговорен и вариант с приставкой: фамилия, имя + приставка (Ларошфуко, Франсуа де). --Дмитрий 13:35, 31 Май 2005 (UTC)

Пользуясь случаем, позвольте спросить: а что бот умеет или на что он способен? И как это осуществляется технически? --Дмитрий 13:42, 31 Май 2005 (UTC)

Умеет — всё что алгоритмизуемо. ;-) --Begemotv2718 21:15, 31 Май 2005 (UTC)

Раз уж персон собрали в одной категории Персоналии по алфавиту, то упрощается задача создания всех редиректов на них. Сейчас для подавляющего большинства есть лишь статья вида Ф., И. О. Что нужно сделать (описание алгоритма):
перед записью любой статьи проверка, нет ли уже такой статьи, если есть, то ничего не делать.
redirect И О Ф
redirect И Ф
redirect Ф
redirect Ф, И
redirect Ф И
redirect Ф И О

Если название статьи из 4 слов — Ф, И1 И2 И3, то
redirect И1 И2 И3 Ф
redirect И1 И2 Ф
redirect И1 Ф
redirect Ф
redirect Ф, И1 И2
redirect Ф, И1

Для 2-х или более 4-х слов алгоритм понятен.

По поводу приставок фон ля и пр., часто видел и то и др. написание, так что не помешают оба.

Чтобы не было сомнений в работе бота, надо записать всё на страницу, которую я готов проверить и поудалять всё ненужное. --Дмитрий (DaeX) 08:28, 2 ноября 2005 (UTC)

Полезность такого бота понятна, только вот объёмы уж очень большие. Сейчас в Википедии более 8 000 статей о персонах. Следовательно, исходя из предложенного алгоритма, потребуется создать более 40 000 статей-редиректов. Это не шутка. --CodeMonk 16:59, 2 ноября 2005 (UTC)
И всё для того, чтобы оставить формат "Фамилия, Имя Отчество"? Ну почему мы так на это напираем?! - ни одна из других языков этого не делает - мы единственные. --Yurik 07:02, 14 июня 2006 (UTC)
 

Static Wikipedia (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -

Static Wikipedia 2007 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -

Static Wikipedia 2006 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu

Static Wikipedia February 2008 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu