Last change
on this file since 36040 was 36040, checked in by davidb, 2 years ago |
Initial cut at GS3 collection indexing the source texts to the macronizer server
|
File size:
4.5 KB
|
Rev | Line | |
---|
[36040] | 1 | | From svn.tartarus.org/snowball/trunk/website/algorithms/portuguese/stop.txt
|
---|
| 2 | | This file is distributed under the BSD License.
|
---|
| 3 | | See http://snowball.tartarus.org/license.php
|
---|
| 4 | | Also see http://www.opensource.org/licenses/bsd-license.html
|
---|
| 5 | | - Encoding was converted to UTF-8.
|
---|
| 6 | | - This notice was added.
|
---|
| 7 | |
|
---|
| 8 | | NOTE: To use this file with StopFilterFactory, you must specify format="snowball"
|
---|
| 9 |
|
---|
| 10 | | A Portuguese stop word list. Comments begin with vertical bar. Each stop
|
---|
| 11 | | word is at the start of a line.
|
---|
| 12 |
|
---|
| 13 |
|
---|
| 14 | | The following is a ranked list (commonest to rarest) of stopwords
|
---|
| 15 | | deriving from a large sample of text.
|
---|
| 16 |
|
---|
| 17 | | Extra words have been added at the end.
|
---|
| 18 |
|
---|
| 19 | de | of, from
|
---|
| 20 | a | the; to, at; her
|
---|
| 21 | o | the; him
|
---|
| 22 | que | who, that
|
---|
| 23 | e | and
|
---|
| 24 | do | de + o
|
---|
| 25 | da | de + a
|
---|
| 26 | em | in
|
---|
| 27 | um | a
|
---|
| 28 | para | for
|
---|
| 29 | | é from SER
|
---|
| 30 | com | with
|
---|
| 31 | não | not, no
|
---|
| 32 | uma | a
|
---|
| 33 | os | the; them
|
---|
| 34 | no | em + o
|
---|
| 35 | se | himself etc
|
---|
| 36 | na | em + a
|
---|
| 37 | por | for
|
---|
| 38 | mais | more
|
---|
| 39 | as | the; them
|
---|
| 40 | dos | de + os
|
---|
| 41 | como | as, like
|
---|
| 42 | mas | but
|
---|
| 43 | | foi from SER
|
---|
| 44 | ao | a + o
|
---|
| 45 | ele | he
|
---|
| 46 | das | de + as
|
---|
| 47 | | tem from TER
|
---|
| 48 | Ã | a + a
|
---|
| 49 | seu | his
|
---|
| 50 | sua | her
|
---|
| 51 | ou | or
|
---|
| 52 | | ser from SER
|
---|
| 53 | quando | when
|
---|
| 54 | muito | much
|
---|
| 55 | | há from HAV
|
---|
| 56 | nos | em + os; us
|
---|
| 57 | já | already, now
|
---|
| 58 | | está from EST
|
---|
| 59 | eu | I
|
---|
| 60 | também | also
|
---|
| 61 | só | only, just
|
---|
| 62 | pelo | per + o
|
---|
| 63 | pela | per + a
|
---|
| 64 | até | up to
|
---|
| 65 | isso | that
|
---|
| 66 | ela | he
|
---|
| 67 | entre | between
|
---|
| 68 | | era from SER
|
---|
| 69 | depois | after
|
---|
| 70 | sem | without
|
---|
| 71 | mesmo | same
|
---|
| 72 | aos | a + os
|
---|
| 73 | | ter from TER
|
---|
| 74 | seus | his
|
---|
| 75 | quem | whom
|
---|
| 76 | nas | em + as
|
---|
| 77 | me | me
|
---|
| 78 | esse | that
|
---|
| 79 | eles | they
|
---|
| 80 | | estão from EST
|
---|
| 81 | você | you
|
---|
| 82 | | tinha from TER
|
---|
| 83 | | foram from SER
|
---|
| 84 | essa | that
|
---|
| 85 | num | em + um
|
---|
| 86 | nem | nor
|
---|
| 87 | suas | her
|
---|
| 88 | meu | my
|
---|
| 89 | Ã s | a + as
|
---|
| 90 | minha | my
|
---|
| 91 | | têm from TER
|
---|
| 92 | numa | em + uma
|
---|
| 93 | pelos | per + os
|
---|
| 94 | elas | they
|
---|
| 95 | | havia from HAV
|
---|
| 96 | | seja from SER
|
---|
| 97 | qual | which
|
---|
| 98 | | será from SER
|
---|
| 99 | nós | we
|
---|
| 100 | | tenho from TER
|
---|
| 101 | lhe | to him, her
|
---|
| 102 | deles | of them
|
---|
| 103 | essas | those
|
---|
| 104 | esses | those
|
---|
| 105 | pelas | per + as
|
---|
| 106 | este | this
|
---|
| 107 | | fosse from SER
|
---|
| 108 | dele | of him
|
---|
| 109 |
|
---|
| 110 | | other words. There are many contractions such as naquele = em+aquele,
|
---|
| 111 | | mo = me+o, but they are rare.
|
---|
| 112 | | Indefinite article plural forms are also rare.
|
---|
| 113 |
|
---|
| 114 | tu | thou
|
---|
| 115 | te | thee
|
---|
| 116 | vocês | you (plural)
|
---|
| 117 | vos | you
|
---|
| 118 | lhes | to them
|
---|
| 119 | meus | my
|
---|
| 120 | minhas
|
---|
| 121 | teu | thy
|
---|
| 122 | tua
|
---|
| 123 | teus
|
---|
| 124 | tuas
|
---|
| 125 | nosso | our
|
---|
| 126 | nossa
|
---|
| 127 | nossos
|
---|
| 128 | nossas
|
---|
| 129 |
|
---|
| 130 | dela | of her
|
---|
| 131 | delas | of them
|
---|
| 132 |
|
---|
| 133 | esta | this
|
---|
| 134 | estes | these
|
---|
| 135 | estas | these
|
---|
| 136 | aquele | that
|
---|
| 137 | aquela | that
|
---|
| 138 | aqueles | those
|
---|
| 139 | aquelas | those
|
---|
| 140 | isto | this
|
---|
| 141 | aquilo | that
|
---|
| 142 |
|
---|
| 143 | | forms of estar, to be (not including the infinitive):
|
---|
| 144 | estou
|
---|
| 145 | está
|
---|
| 146 | estamos
|
---|
| 147 | estão
|
---|
| 148 | estive
|
---|
| 149 | esteve
|
---|
| 150 | estivemos
|
---|
| 151 | estiveram
|
---|
| 152 | estava
|
---|
| 153 | estávamos
|
---|
| 154 | estavam
|
---|
| 155 | estivera
|
---|
| 156 | estivéramos
|
---|
| 157 | esteja
|
---|
| 158 | estejamos
|
---|
| 159 | estejam
|
---|
| 160 | estivesse
|
---|
| 161 | estivéssemos
|
---|
| 162 | estivessem
|
---|
| 163 | estiver
|
---|
| 164 | estivermos
|
---|
| 165 | estiverem
|
---|
| 166 |
|
---|
| 167 | | forms of haver, to have (not including the infinitive):
|
---|
| 168 | hei
|
---|
| 169 | há
|
---|
| 170 | havemos
|
---|
| 171 | hão
|
---|
| 172 | houve
|
---|
| 173 | houvemos
|
---|
| 174 | houveram
|
---|
| 175 | houvera
|
---|
| 176 | houvéramos
|
---|
| 177 | haja
|
---|
| 178 | hajamos
|
---|
| 179 | hajam
|
---|
| 180 | houvesse
|
---|
| 181 | houvéssemos
|
---|
| 182 | houvessem
|
---|
| 183 | houver
|
---|
| 184 | houvermos
|
---|
| 185 | houverem
|
---|
| 186 | houverei
|
---|
| 187 | houverá
|
---|
| 188 | houveremos
|
---|
| 189 | houverão
|
---|
| 190 | houveria
|
---|
| 191 | houverÃamos
|
---|
| 192 | houveriam
|
---|
| 193 |
|
---|
| 194 | | forms of ser, to be (not including the infinitive):
|
---|
| 195 | sou
|
---|
| 196 | somos
|
---|
| 197 | são
|
---|
| 198 | era
|
---|
| 199 | éramos
|
---|
| 200 | eram
|
---|
| 201 | fui
|
---|
| 202 | foi
|
---|
| 203 | fomos
|
---|
| 204 | foram
|
---|
| 205 | fora
|
---|
| 206 | fÃŽramos
|
---|
| 207 | seja
|
---|
| 208 | sejamos
|
---|
| 209 | sejam
|
---|
| 210 | fosse
|
---|
| 211 | fÃŽssemos
|
---|
| 212 | fossem
|
---|
| 213 | for
|
---|
| 214 | formos
|
---|
| 215 | forem
|
---|
| 216 | serei
|
---|
| 217 | será
|
---|
| 218 | seremos
|
---|
| 219 | serão
|
---|
| 220 | seria
|
---|
| 221 | serÃamos
|
---|
| 222 | seriam
|
---|
| 223 |
|
---|
| 224 | | forms of ter, to have (not including the infinitive):
|
---|
| 225 | tenho
|
---|
| 226 | tem
|
---|
| 227 | temos
|
---|
| 228 | tém
|
---|
| 229 | tinha
|
---|
| 230 | tÃnhamos
|
---|
| 231 | tinham
|
---|
| 232 | tive
|
---|
| 233 | teve
|
---|
| 234 | tivemos
|
---|
| 235 | tiveram
|
---|
| 236 | tivera
|
---|
| 237 | tivéramos
|
---|
| 238 | tenha
|
---|
| 239 | tenhamos
|
---|
| 240 | tenham
|
---|
| 241 | tivesse
|
---|
| 242 | tivéssemos
|
---|
| 243 | tivessem
|
---|
| 244 | tiver
|
---|
| 245 | tivermos
|
---|
| 246 | tiverem
|
---|
| 247 | terei
|
---|
| 248 | terá
|
---|
| 249 | teremos
|
---|
| 250 | terão
|
---|
| 251 | teria
|
---|
| 252 | terÃamos
|
---|
| 253 | teriam
|
---|
Note:
See
TracBrowser
for help on using the repository browser.