Skip to content

Commit

Permalink
Using PSR-4 and update Readme file
Browse files Browse the repository at this point in the history
  • Loading branch information
yeremi committed Jun 10, 2019
1 parent 838f6f9 commit dd345d8
Show file tree
Hide file tree
Showing 3 changed files with 80 additions and 53 deletions.
10 changes: 7 additions & 3 deletions README.md
Original file line number Diff line number Diff line change
@@ -1,7 +1,11 @@
# StopWords for Portuguese Brazilian Language / PT-BR
PHP client StopWords for Portuguese Brazilian Language
One of our major performance optimizations for query is filtered and removing the most unless common Portuguese dictionary words before submitting queries to the database full text engine. It's shocking to see how little of most posts remain when you remove empty words from the Portuguese dictionary.
This StopWord contain 603 "stop words" collection that helps narrow and narrow query results by running the query dramatically faster.
##### PHP client StopWords for Portuguese Brazilian Language

One of our major performance optimizations for query is filtering and removing the most unless common Portuguese dictionary words before submitting queries to the database full text engine.
It's shocking to see what happens when you remove the empty words from the Portuguese dictionary.

This StopWord contains a collection of 603 "stop words" that helps filter and narrow query results by running a query dramatically faster.

You can also use stop words in SEO to avoid search engines, saving space and time in processing large data during crawling or indexing.

## Setup
Expand Down
40 changes: 33 additions & 7 deletions composer.json
Original file line number Diff line number Diff line change
@@ -1,19 +1,45 @@
{
"name": "yeremi/stopwords",
"description": "StopWords is a simple stop words for Português Brazilian Language.",
"keywords": ["stopwords","portuguese"],
"description": "PHP client StopWords for Portuguese Brazilian Language",
"version": "1.0.1",
"keywords": [
"stopwords",
"portuguese",
"snowball",
"searchengine",
"elasticsearch",
"seo",
"stemming",
"filter",
"natural language processing"
],
"homepage": "https://github.com/yeremi/stopwords",
"license": "SEE LICENSE IN LICENSE.md",
"authors": [
{
"name": "Yeremi Loli",
"email": "yeremi@nohelmet.com"
"email": "yeremiloli@yahoo.com"
}
],
"require": {
"php": "^5.3.3 || ^7.0"
"php": "^7.0"
},
"repositories": [
{
"type": "git",
"url": "https://github.com/yeremi/stopwords.git"
}
],
"autoload": {
"psr-0": {
"Yeremi": "src"
"psr-4": {
"Yeremi\\": "src/"
}
},
"require-dev": {
"friendsofphp/php-cs-fixer": "^2.15"
},
"scripts": {
"check-style": "php-cs-fixer fix --diff --verbose --dry-run src/StopWords.php",
"fix-style": "php-cs-fixer fix src/StopWords.php"
}
}
}
83 changes: 40 additions & 43 deletions src/StopWords.php
Original file line number Diff line number Diff line change
@@ -1,23 +1,21 @@
<?php
/**
* StopWords is a simple class for Portuguese Brazilian Language.
* This class is in continuous development.
* PHP client StopWords for Portuguese Brazilian Language
*
* @author Yeremi Loli <yeremi@nohelmet.com>
* @author Yeremi Loli <yeremiloli@yahoo.com>
* @license GNU General Public License v3.0
*/

namespace Yeremi;


/**
* Class StopWords
* @package Yeremi
*/
class StopWords
{

/**
* @param $string
*
* @return array
*/
public static function stop($string)
Expand All @@ -26,8 +24,9 @@ public static function stop($string)
$subject = preg_replace('/(?![.=$\'€%-])\p{P}/u', ' ', $subject);
$subject = preg_replace('/[0-9]+/', '', $subject);
$subject = trim(str_replace('.', ' ', $subject));
$tags = array_filter(array_unique(explode(" ", $subject)));
$tags = array_diff($tags, self::words());
$tags = array_filter(array_unique(explode(' ', $subject)));
$tags = array_diff($tags, self::words());

return array_values($tags);
}

Expand All @@ -36,40 +35,38 @@ public static function stop($string)
*/
public static function words()
{
return [
"abaixo", "aca", "acaso", "acerca", "acima", "acola", "acula", "ademais", "adentro", "adiante", "afinal", "afora", "agora", "agorinha", "ah", "ainda", "alem", "algo",
"alguem", "algum", "alguma", "algumas", "alguns", "ali", "alias", "alo", "ambos", "amiude", "ante", "antes", "ao", "aonde", "aos", "apenas", "apesar", "apos", "apud",
"aquela", "aquelas", "aquele", "aqueles", "aqui", "aquilo", "as", "assim", "ate", "atras", "atraves", "basicamente", "bastante", "bastantes", "bem", "bis", "bom", "ca",
"cada", "cade", "caso", "certa", "certamente", "certas", "certeiramente", "certo", "certos", "chez", "chi", "comigo", "como", "comumente", "conforme", "confronte",
"conosco", "conquanto", "consequentemente", "consigo", "consoante", "contanto", "contigo", "contra", "contudo", "convosco", "cuja", "cujas", "cujo", "cujos", "da", "dai",
"dali", "dantes", "daquela", "daquelas", "daquele", "daqueles", "daqui", "daquilo", "das", "de", "debaixo", "defronte", "dela", "delas", "dele", "deles", "demais", "dentre",
"dentro", "depois", "desde", "dessa", "dessas", "desse", "desses", "desta", "destas", "deste", "destes", "detras", "deveras", "diante", "disso", "disto", "diversos", "do",
"donde", "doravante", "dum", "duma", "dumas", "duns", "durante", "eia", "eis", "ela", "elas", "ele", "eles", "em", "embaixo", "embora", "enfim", "enquanto", "entanto", "entao",
"entre", "entretanto", "exceto", "essa", "essas", "esse", "esses", "esta", "estas", "este", "estes", "eu", "exatamente", "exceto", "felizmente", "frequentemente", "fora", "gracas",
"hem", "hum", "ibidem", "idem", "in", "inclusive", "inda", "infelizmente", "inicialmente", "isso", "ja", "jamais", "la", "las", "largamente", "lha", "lhas", "lhe", "lhes", "lho",
"lhos", "lo", "los", "logo", "mais", "mal", "malgrado", "mas", "me", "mediante", "menos", "meramente", "mesma", "mesmas", "mesmo", "mesmos", "meu", "meus", "mim", "minha", "minhas",
"mui", "muita", "muitas", "muitissimo", "muito", "muitos", "mutuamente", "na", "nada", "nadinha", "nalgum", "nalguma", "nalgumas", "nalguns", "naquela", "naquelas", "naquele",
"naqueles", "naquilo", "nao", "nas", "nela", "nelas", "nele", "neles", "nem", "nenhum", "nenhuns", "nenhuma", "nenhumas", "nessa", "nessas", "nesse", "nesses", "nesta", "nestas",
"neste", "nestes", "ninguem", "nisso", "nisto", "no", "nos", "nossa", "nossas", "nosso", "nossos", "noutra", "noutras", "noutro", "noutros", "novamente", "num", "numa", "numas",
"nunca", "nunquinha", "nuns", "oba", "ola", "onde", "ontem", "opa", "ora", "os", "ou", "outra", "outras", "outrem", "outro", "outrora", "outros", "outrossim", "para", "pela", "pelas",
"pelo", "pelos", "per", "perante", "pero", "pois", "por", "porem", "porquanto", "porque", "portanto", "porventura", "possivelmente", "posteriormente", "posto", "pouca", "poucas",
"pouco", "poucos", "pra", "praquela", "praquelas", "praquele", "praqueles", "praquilo", "pras", "praticamente", "prela", "prelas", "prele", "preles", "preste", "prestes", "previamente",
"primeiramente", "principalmente", "priori", "pronto", "propria", "proprias", "proprio", "proprios", "proximo", "qual", "qualquer", "quais", "quaisquer", "quando", "quanta", "quantas",
"quanto", "quantos", "quao", "quase", "que", "quem", "quer", "quica", "raramente", "realmente", "recentemente", "salvante", "se", "segundo", "seguramente", "seja", "sem", "sempre",
"senao", "sequer", "seu", "seus", "sim", "simplesmente", "sob", "sobre", "sobremaneira", "sobremodo", "sobretudo", "somente", "sua", "suas", "tal", "tais", "talvez", "também",
"tampouco", "tanta", "tantas", "tanto", "tantos", "tao", "te", "teu", "teus", "tirante", "toda", "todas", "todavia", "todo", "todos", "tras", "tu", "tua", "tuas", "tudo", "um",
"uma", "umas", "uns", "varias", "varios", "vezes", "visto", "voce", "voces", "vos", "vossa", "vossas", "vossos", "vulgo", "de", "a", "o", "que", "e", "do", "da", "em", "um", "para",
"com", "não", "uma", "os", "no", "se", "na", "por", "mais", "as", "dos", "como", "mas", "ao", "ele", "das", "à", "seu", "sua", "ou", "quando", "muito", "nos", "", "eu", "também",
"", "pelo", "pela", "até", "isso", "ela", "entre", "depois", "sem", "mesmo", "aos", "seus", "quem", "nas", "me", "esse", "eles", "você", "essa", "num", "nem", "suas", "meu", "às",
"minha", "numa", "pelos", "elas", "qual", "nós", "lhe", "deles", "essas", "esses", "pelas", "este", "dele", "tu", "te", "vocês", "vos", "lhes", "meus", "minhas", "teu", "tua", "teus",
"tuas", "nosso", "nossa", "nossos", "nossas", "dela", "delas", "esta", "estes", "estas", "aquele", "aquela", "aqueles", "aquelas", "isto", "aquilo", "estou", "está", "estamos",
"estão", "estive", "esteve", "estivemos", "estiveram", "estava", "estávamos", "estavam", "estivera", "estivéramos", "esteja", "estejamos", "estejam", "estivesse", "estivéssemos",
"estivessem", "estiver", "estivermos", "estiverem", "hei", "", "havemos", "hão", "houve", "houvemos", "houveram", "houvera", "houvéramos", "haja", "hajamos", "hajam", "houvesse",
"houvéssemos", "houvessem", "houver", "houvermos", "houverem", "houverei", "houverá", "houveremos", "houverão", "houveria", "houveríamos", "houveriam", "sou", "somos", "são", "era",
"éramos", "eram", "fui", "foi", "fomos", "foram", "fora", "fôramos", "seja", "sejamos", "sejam", "fosse", "fôssemos", "fossem", "for", "formos", "forem", "serei", "será", "seremos",
"serão", "seria", "seríamos", "seriam", "tenho", "tem", "temos", "tém", "tinha", "tínhamos", "tinham", "tive", "teve", "tivemos", "tiveram", "tivera", "tivéramos", "tenha", "tenhamos",
"tenham", "tivesse", "tivéssemos", "tivessem", "tiver", "tivermos", "tiverem", "terei", "terá", "teremos", "terão", "teria", "teríamos", "teriam", "xícara"
return ['abaixo', 'aca', 'acaso', 'acerca', 'acima', 'acola', 'acula', 'ademais', 'adentro', 'adiante', 'afinal', 'afora', 'agora', 'agorinha', 'ah', 'ainda', 'alem', 'algo',
'alguem', 'algum', 'alguma', 'algumas', 'alguns', 'ali', 'alias', 'alo', 'ambos', 'amiude', 'ante', 'antes', 'ao', 'aonde', 'aos', 'apenas', 'apesar', 'apos', 'apud',
'aquela', 'aquelas', 'aquele', 'aqueles', 'aqui', 'aquilo', 'as', 'assim', 'ate', 'atras', 'atraves', 'basicamente', 'bastante', 'bastantes', 'bem', 'bis', 'bom', 'ca',
'cada', 'cade', 'caso', 'certa', 'certamente', 'certas', 'certeiramente', 'certo', 'certos', 'chez', 'chi', 'comigo', 'como', 'comumente', 'conforme', 'confronte',
'conosco', 'conquanto', 'consequentemente', 'consigo', 'consoante', 'contanto', 'contigo', 'contra', 'contudo', 'convosco', 'cuja', 'cujas', 'cujo', 'cujos', 'da', 'dai',
'dali', 'dantes', 'daquela', 'daquelas', 'daquele', 'daqueles', 'daqui', 'daquilo', 'das', 'de', 'debaixo', 'defronte', 'dela', 'delas', 'dele', 'deles', 'demais', 'dentre',
'dentro', 'depois', 'desde', 'dessa', 'dessas', 'desse', 'desses', 'desta', 'destas', 'deste', 'destes', 'detras', 'deveras', 'diante', 'disso', 'disto', 'diversos', 'do',
'donde', 'doravante', 'dum', 'duma', 'dumas', 'duns', 'durante', 'eia', 'eis', 'ela', 'elas', 'ele', 'eles', 'em', 'embaixo', 'embora', 'enfim', 'enquanto', 'entanto', 'entao',
'entre', 'entretanto', 'exceto', 'essa', 'essas', 'esse', 'esses', 'esta', 'estas', 'este', 'estes', 'eu', 'exatamente', 'exceto', 'felizmente', 'frequentemente', 'fora', 'gracas',
'hem', 'hum', 'ibidem', 'idem', 'in', 'inclusive', 'inda', 'infelizmente', 'inicialmente', 'isso', 'ja', 'jamais', 'la', 'las', 'largamente', 'lha', 'lhas', 'lhe', 'lhes', 'lho',
'lhos', 'lo', 'los', 'logo', 'mais', 'mal', 'malgrado', 'mas', 'me', 'mediante', 'menos', 'meramente', 'mesma', 'mesmas', 'mesmo', 'mesmos', 'meu', 'meus', 'mim', 'minha', 'minhas',
'mui', 'muita', 'muitas', 'muitissimo', 'muito', 'muitos', 'mutuamente', 'na', 'nada', 'nadinha', 'nalgum', 'nalguma', 'nalgumas', 'nalguns', 'naquela', 'naquelas', 'naquele',
'naqueles', 'naquilo', 'nao', 'nas', 'nela', 'nelas', 'nele', 'neles', 'nem', 'nenhum', 'nenhuns', 'nenhuma', 'nenhumas', 'nessa', 'nessas', 'nesse', 'nesses', 'nesta', 'nestas',
'neste', 'nestes', 'ninguem', 'nisso', 'nisto', 'no', 'nos', 'nossa', 'nossas', 'nosso', 'nossos', 'noutra', 'noutras', 'noutro', 'noutros', 'novamente', 'num', 'numa', 'numas',
'nunca', 'nunquinha', 'nuns', 'oba', 'ola', 'onde', 'ontem', 'opa', 'ora', 'os', 'ou', 'outra', 'outras', 'outrem', 'outro', 'outrora', 'outros', 'outrossim', 'para', 'pela', 'pelas',
'pelo', 'pelos', 'per', 'perante', 'pero', 'pois', 'por', 'porem', 'porquanto', 'porque', 'portanto', 'porventura', 'possivelmente', 'posteriormente', 'posto', 'pouca', 'poucas',
'pouco', 'poucos', 'pra', 'praquela', 'praquelas', 'praquele', 'praqueles', 'praquilo', 'pras', 'praticamente', 'prela', 'prelas', 'prele', 'preles', 'preste', 'prestes', 'previamente',
'primeiramente', 'principalmente', 'priori', 'pronto', 'propria', 'proprias', 'proprio', 'proprios', 'proximo', 'qual', 'qualquer', 'quais', 'quaisquer', 'quando', 'quanta', 'quantas',
'quanto', 'quantos', 'quao', 'quase', 'que', 'quem', 'quer', 'quica', 'raramente', 'realmente', 'recentemente', 'salvante', 'se', 'segundo', 'seguramente', 'seja', 'sem', 'sempre',
'senao', 'sequer', 'seu', 'seus', 'sim', 'simplesmente', 'sob', 'sobre', 'sobremaneira', 'sobremodo', 'sobretudo', 'somente', 'sua', 'suas', 'tal', 'tais', 'talvez', 'também',
'tampouco', 'tanta', 'tantas', 'tanto', 'tantos', 'tao', 'te', 'teu', 'teus', 'tirante', 'toda', 'todas', 'todavia', 'todo', 'todos', 'tras', 'tu', 'tua', 'tuas', 'tudo', 'um',
'uma', 'umas', 'uns', 'varias', 'varios', 'vezes', 'visto', 'voce', 'voces', 'vos', 'vossa', 'vossas', 'vossos', 'vulgo', 'de', 'a', 'o', 'que', 'e', 'do', 'da', 'em', 'um', 'para',
'com', 'não', 'uma', 'os', 'no', 'se', 'na', 'por', 'mais', 'as', 'dos', 'como', 'mas', 'ao', 'ele', 'das', 'à', 'seu', 'sua', 'ou', 'quando', 'muito', 'nos', '', 'eu', 'também',
'', 'pelo', 'pela', 'até', 'isso', 'ela', 'entre', 'depois', 'sem', 'mesmo', 'aos', 'seus', 'quem', 'nas', 'me', 'esse', 'eles', 'você', 'essa', 'num', 'nem', 'suas', 'meu', 'às',
'minha', 'numa', 'pelos', 'elas', 'qual', 'nós', 'lhe', 'deles', 'essas', 'esses', 'pelas', 'este', 'dele', 'tu', 'te', 'vocês', 'vos', 'lhes', 'meus', 'minhas', 'teu', 'tua', 'teus',
'tuas', 'nosso', 'nossa', 'nossos', 'nossas', 'dela', 'delas', 'esta', 'estes', 'estas', 'aquele', 'aquela', 'aqueles', 'aquelas', 'isto', 'aquilo', 'estou', 'está', 'estamos',
'estão', 'estive', 'esteve', 'estivemos', 'estiveram', 'estava', 'estávamos', 'estavam', 'estivera', 'estivéramos', 'esteja', 'estejamos', 'estejam', 'estivesse', 'estivéssemos',
'estivessem', 'estiver', 'estivermos', 'estiverem', 'hei', '', 'havemos', 'hão', 'houve', 'houvemos', 'houveram', 'houvera', 'houvéramos', 'haja', 'hajamos', 'hajam', 'houvesse',
'houvéssemos', 'houvessem', 'houver', 'houvermos', 'houverem', 'houverei', 'houverá', 'houveremos', 'houverão', 'houveria', 'houveríamos', 'houveriam', 'sou', 'somos', 'são', 'era',
'éramos', 'eram', 'fui', 'foi', 'fomos', 'foram', 'fora', 'fôramos', 'seja', 'sejamos', 'sejam', 'fosse', 'fôssemos', 'fossem', 'for', 'formos', 'forem', 'serei', 'será', 'seremos',
'serão', 'seria', 'seríamos', 'seriam', 'tenho', 'tem', 'temos', 'tém', 'tinha', 'tínhamos', 'tinham', 'tive', 'teve', 'tivemos', 'tiveram', 'tivera', 'tivéramos', 'tenha', 'tenhamos',
'tenham', 'tivesse', 'tivéssemos', 'tivessem', 'tiver', 'tivermos', 'tiverem', 'terei', 'terá', 'teremos', 'terão', 'teria', 'teríamos', 'teriam', 'xícara',
];
}

}
}

0 comments on commit dd345d8

Please sign in to comment.