root/main/trunk/model-sites-dev/atea/collect/digital-nz/etc/conf/lang/stopwords_ru.txt @ 33166

Revision 33166, 7.7 KB (checked in by davidb, 4 months ago)

Collection config files and initial programming work for atea collections

Line 
1 | From svn.tartarus.org/snowball/trunk/website/algorithms/russian/stop.txt
2 | This file is distributed under the BSD License.
3 | See http://snowball.tartarus.org/license.php
4 | Also see http://www.opensource.org/licenses/bsd-license.html
5 |  - Encoding was converted to UTF-8.
6 |  - This notice was added.
7 |
8 | NOTE: To use this file with StopFilterFactory, you must specify format="snowball"
9
10 | a russian stop word list. comments begin with vertical bar. each stop
11 | word is at the start of a line.
12
13 | this is a ranked list (commonest to rarest) of stopwords derived from
14 | a large text sample.
15
16 | letter `ё' is translated to `е'.
17
18О              | and
19в              | in/into
20вП             | alternative form
21Ме             | not
22чтП            | what/that
23ПМ             | he
24Ма             | on/onto
25я              | i
26с              | from
27сП             | alternative form
28как            | how
29а              | milder form of `no' (but)
30тП             | conjunction and form of `that'
31все            | all
32ПМа            | she
33так            | so, thus
34егП            | him
35МП             | but
36Ўа             | yes/and
37ты             | thou
38к              | towards, by
39у              | around, chez
40же             | intensifier particle
41вы             | you
42за             | beyond, behind
43бы             | conditional/subj. particle
44пП             | up to, along
45тПлькП         | only
46ее             | her
47ЌМе            | to me
48былП           | it was
49вПт            | here is/are, particle
50Пт             | away from
51ЌеМя           | me
52еще            | still, yet, more
53Мет            | no, there isnt/arent
54П              | about
55Оз             | out of
56еЌу            | to him
57теперь         | now
58кПгЎа          | when
59Ўаже           | even
60Му             | so, well
61вЎруг          | suddenly
62лО             | interrogative particle
63еслО           | if
64уже            | already, but homonym of `narrower'
65ОлО            | or
66МО             | neither
67быть           | to be
68был            | he was
69МегП           | prepositional form of егП
70ЎП             | up to
71вас            | you accusative
72МОбуЎь         | indef. suffix preceded by hyphen
73Ппять          | again
74уж             | already, but homonym of `adder'
75ваЌ            | to you
76сказал         | he said
77веЎь           | particle `after all'
78таЌ            | there
79пПтПЌ          | then
80себя           | oneself
81МОчегП         | nothing
82ей             | to her
83ЌПжет          | usually with `быть' as `maybe'
84ПМО            | they
85тут            | here
86гЎе            | where
87есть           | there is/are
88МаЎП           | got to, must
89Мей            | prepositional form of  ей
90Ўля            | for
91Ќы             | we
92тебя           | thee
93Ох             | them, their
94чеЌ            | than
95была           | she was
96саЌ            | self
97чтПб           | in order to
98без            | without
99буЎтП          | as if
100челПвек        | man, person, one
101чегП           | genitive form of `what'
102раз            | once
103тПже           | also
104себе           | to oneself
105пПЎ            | beneath
106жОзМь          | life
107буЎет          | will be
108ж              | short form of intensifer particle `же'
109тПгЎа          | then
110ктП            | who
111этПт           | this
112гПвПрОл        | was saying
113тПгП           | genitive form of `that'
114пПтПЌу         | for that reason
115этПгП          | genitive form of `this'
116какПй          | which
117сПвсеЌ         | altogether
118МОЌ            | prepositional form of `егП', `ПМО'
119зЎесь          | here
120этПЌ           | prepositional form of `этПт'
121ПЎОМ           | one
122пПчтО          | almost
123ЌПй            | my
124теЌ            | instrumental/dative plural of `тПт', `тП'
125чтПбы          | full form of `in order that'
126Мее            | her (acc.)
127кажется        | it seems
128сейчас         | now
129былО           | they were
130куЎа           | where to
131зачеЌ          | why
132сказать        | to say
133всех           | all (acc., gen. preposn. plural)
134МОкПгЎа        | never
135сегПЎМя        | today
136ЌПжМП          | possible, one can
137прО            | by
138МакПМец        | finally
139Ўва            | two
140Пб             | alternative form of `П', about
141ЎругПй         | another
142хПть           | even
143пПсле          | after
144МаЎ            | above
145бПльше         | more
146тПт            | that one (masc.)
147через          | across, in
148этО            | these
149Мас            | us
150прП            | about
151всегП          | in all, only, of all
152МОх            | prepositional form of `ПМО' (they)
153какая          | which, feminine
154ЌМПгП          | lots
155разве          | interrogative particle
156сказала        | she said
157трО            | three
158эту            | this, acc. fem. sing.
159ЌПя            | my, feminine
160впрПчеЌ        | moreover, besides
161хПрПшП         | good
162свПю           | ones own, acc. fem. sing.
163этПй           | oblique form of `эта', fem. `this'
164переЎ          | in front of
165ОМПгЎа         | sometimes
166лучше          | better
167чуть           | a little
168тПЌ            | preposn. form of `that one'
169Мельзя         | one must not
170такПй          | such a one
171ОЌ             | to them
172бПлее          | more
173всегЎа         | always
174кПМечМП        | of course
175всю            | acc. fem. sing of `all'
176ЌежЎу          | between
177
178
179  | b: some paradigms
180  |
181  | personal pronouns
182  |
183  | я  ЌеМя  ЌМе  ЌМПй  [ЌМПю]
184  | ты  тебя  тебе  тПбПй  [тПбПю]
185  | ПМ  егП  еЌу  ОЌ  [МегП, МеЌу, МОЌ]
186  | ПМа  ее  эО  ею  [Мее, МэО, Мею]
187  | ПМП  егП  еЌу  ОЌ  [МегП, МеЌу, МОЌ]
188  |
189  | Ќы  Мас  МаЌ  МаЌО
190  | вы  вас  ваЌ  ваЌО
191  | ПМО  Ох  ОЌ  ОЌО  [МОх, МОЌ, МОЌО]
192  |
193  |   ÑÐµÐ±Ñ  себе  сПбПй   [сПбПю]
194  |
195  | demonstrative pronouns: этПт (this), тПт (that)
196  |
197  | этПт  эта  этП  этО
198  | этПгП  эты  этП  этО
199  | этПгП  этПй  этПгП  этОх
200  | этПЌу  этПй  этПЌу  этОЌ
201  | этОЌ  этПй  этОЌ  [этПю]  этОЌО
202  | этПЌ  этПй  этПЌ  этОх
203  |
204  | тПт  та  тП  те
205  | тПгП  ту  тП  те
206  | тПгП  тПй  тПгП  тех
207  | тПЌу  тПй  тПЌу  теЌ
208  | теЌ  тПй  теЌ  [тПю]  теЌО
209  | тПЌ  тПй  тПЌ  тех
210  |
211  | determinative pronouns
212  |
213  | (a) весь (all)
214  |
215  | весь  вся  все  все
216  | всегП  всю  все  все
217  | всегП  всей  всегП  всех
218  | всеЌу  всей  всеЌу  всеЌ
219  | всеЌ  всей  всеЌ  [всею]  всеЌО
220  | всеЌ  всей  всеЌ  всех
221  |
222  | (b) саЌ (himself etc)
223  |
224  | саЌ  саЌа  саЌП  саЌО
225  | саЌПгП саЌу  саЌП  саЌОх
226  | саЌПгП саЌПй саЌПгП  саЌОх
227  | саЌПЌу саЌПй саЌПЌу  саЌОЌ
228  | саЌОЌ  саЌПй  саЌОЌ  [саЌПю]  саЌОЌО
229  | саЌПЌ саЌПй саЌПЌ  саЌОх
230  |
231  | stems of verbs `to be', `to have', `to do' and modal
232  |
233  | быть  бы  буЎ  быв  есть  суть
234  | ОЌе
235  | Ўел
236  | ЌПг   ÐŒÐŸÐ¶  ЌПчь
237  | уЌе
238  | хПч  хПт
239  | ЎПлж
240  | ЌПжМ
241  | МужМ
242  | Мельзя
243
Note: See TracBrowser for help on using the browser.