informatica:linux:diccionarios:catala
Differences
This shows you the differences between two versions of the page.
Next revision | Previous revision | ||
informatica:linux:diccionarios:catala [2022/02/28 10:01] – created jose | informatica:linux:diccionarios:catala [2022/02/28 21:40] (current) – jose | ||
---|---|---|---|
Line 1: | Line 1: | ||
+ | ====== Comandes: ====== | ||
+ | Busca si una PARAULA existeix: | ||
+ | curl -X POST --data " | ||
+ | També es pot buscar amb el post a la url però falla amb caràcters especials com à, | ||
+ | curl -s " | ||
+ | Buscar per ID: | ||
+ | https:// | ||
+ | |||
Descarreguem totes les paraules de https:// | Descarreguem totes les paraules de https:// | ||
Line 22: | Line 30: | ||
Al web surt així | Al web surt així | ||
{{: | {{: | ||
+ | |||
+ | Amb aquesta consulta treiem tots els resultats: | ||
+ | grep ' | ||
+ | grep ' | ||
+ | |||
+ | Explicació: | ||
+ | - amb awk -F '< | ||
+ | < | ||
+ | <div id=" | ||
+ | <h2 xmlns: | ||
+ | <span class=" | ||
+ | silf | ||
+ | </ | ||
+ | sílfide | ||
+ | </ | ||
+ | </ | ||
+ | |||
+ | Qeuda així: | ||
+ | < | ||
+ | | ||
+ | div id=" | ||
+ | |||
+ | h2 xmlns: | ||
+ | |||
+ | span class=" | ||
+ | silf | ||
+ | /span | ||
+ | |||
+ | </ | ||
+ | |||
+ | El que fem es buscar quan un camp es **span class=" | ||
+ | |||
+ | |||
+ | |||
+ | amb aquesta consulta ens dona la segona part de la línia, la de " | ||
+ | grep ' | ||
+ | |||
+ | < | ||
+ | -ada | ||
+ | </ | ||
+ | |||
+ | |||
+ | Amb això treiem la primera i la segona definició: | ||
+ | grep ' | ||
+ | alesiat | ||
+ | grep ' | ||
+ | alesiada | ||
+ | |||
+ | Busquem amb awk que el paràmetre $8 comenci per - i escribim la paraula, que es el paràmetre 5 i el sufix que es el 8 | ||
+ | grep ' | ||
+ | Ens dona una llista com aquesta: | ||
+ | romandalusí -ina | ||
+ | reconegut -uda | ||
+ | -nervi -nèrvia | ||
+ | boreoalpí -ina | ||
+ | galileà -ana | ||
+ | glotalitzat -ada | ||
+ | este -a | ||
+ | morenc -a | ||
+ | |||
+ | A partir d'aqui busquem patrons, per exemple: | ||
+ | este -a | ||
+ | morenc -a | ||
+ | Seria este/esta i morenc/ | ||
+ | |||
+ | Treiem tots els sufixos: | ||
+ | grep ' | ||
+ | Treiem sufixos de sufixos, es a dir: | ||
+ | < | ||
+ | -adelf -adelfa | ||
+ | -agog -agoga | ||
+ | -àlgic -àlgica | ||
+ | -àmbul -àmbula | ||
+ | -andre -andra | ||
+ | </ | ||
+ | Treiem els que comencin amb - dient: $5 !~ /^-/ | ||
+ | grep ' | ||
+ | |||
+ | |||
+ | Busquem sufix -a i que la paraula acabi amb e: | ||
+ | grep ' | ||
+ | O els que acaben amb vocal: | ||
+ | grep ' | ||
+ | |||
+ | |||
+ | ====== Buscar definicions de sufixes: ====== | ||
+ | |||
+ | < | ||
+ | #!/bin/bash | ||
+ | > | ||
+ | while read linea | ||
+ | do | ||
+ | paraula=`echo $linea |awk {' | ||
+ | sufix=`echo $linea |awk {' | ||
+ | if [ $sufix == " | ||
+ | then | ||
+ | #si acaba amb consonant, no trec res i si acaba amb consonant trec 1 caràcter | ||
+ | echo ${paraula: -1} | ||
+ | echo ${paraula: -1} | grep [aeiou] | ||
+ | if [[ "`echo ${paraula: -1} | grep [aeiouàèìòùáéíóúäëïöüâêîôû]`" | ||
+ | then | ||
+ | echo " | ||
+ | let resta=0 | ||
+ | else | ||
+ | let resta=1 | ||
+ | fi | ||
+ | elif [ $sufix == " | ||
+ | then | ||
+ | let resta=1 | ||
+ | elif [ $sufix == " | ||
+ | then | ||
+ | let resta=2 | ||
+ | else | ||
+ | let resta=(${# | ||
+ | fi | ||
+ | if [ $resta -eq 0 ] | ||
+ | then | ||
+ | echo ${paraula}$sufix" | ||
+ | else | ||
+ | echo ${paraula:: | ||
+ | fi | ||
+ | # echo | ||
+ | done < <( grep ' | ||
+ | |||
+ | while read linea | ||
+ | do | ||
+ | #abans treia les tildes perquè feia el POST a la mateixa URL, ara faig amb -X POST | ||
+ | # | ||
+ | |||
+ | echo $lnea | ||
+ | until torify curl -s -o definicions_sufix/ | ||
+ | do | ||
+ | echo " | ||
+ | sudo / | ||
+ | done | ||
+ | done < <(cat paraules_amb_sufix |awk {' | ||
+ | |||
+ | </ | ||
+ |
informatica/linux/diccionarios/catala.1646042516.txt.gz · Last modified: 2022/02/28 10:01 by jose