User Tools

Site Tools


informatica:linux:diccionarios:catala

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
informatica:linux:diccionarios:catala [2022/02/28 16:54] joseinformatica:linux:diccionarios:catala [2022/02/28 21:40] (current) jose
Line 30: Line 30:
 Al web surt així Al web surt així
 {{:informatica:linux:diccionarios:alesiat.png|}} {{:informatica:linux:diccionarios:alesiat.png|}}
 +
 +Amb aquesta consulta treiem tots els resultats:
 +  grep 'id="Definition"' 0*  |awk -F '<|>' '{for(i=1;i<=NF-2;i++) if ( $i ~ /title/  ) printf $i" - "$(i+1)"\n"}'
 +  grep 'id="Definition"' 0*  |awk -F '<|>' '{for(i=1;i<=NF-2;i++) if ( $i ~ /title/  ) print $(i+1)}'
 +
 +Explicació:
 +  - amb awk -F '<|>' treiem el que hi ha entre < i >:
 +<code>
 +<div id="Definition" class="resultDefinition">
 +<h2 xmlns:fo="http://www.w3.org/1999/XSL/Format">
 +<span class="title">
 +silf 
 +</span><span class="title">
 +sílfide 
 +</span>
 +</code>
 +
 +Qeuda així:
 +<code>
 +                
 +div id="Definition" class="resultDefinition"
 +
 +h2 xmlns:fo="http://www.w3.org/1999/XSL/Format"
 +
 +span class="title"
 +silf 
 +/span
 +
 +</code>
 +
 +El que fem es buscar quan un camp es **span class="title"** imprimim el següent
 +
 +
  
 amb aquesta consulta ens dona la segona part de la línia, la de "-ada" amb aquesta consulta ens dona la segona part de la línia, la de "-ada"
Line 94: Line 127:
   then    then 
     #si acaba amb consonant, no trec res i si acaba amb consonant trec 1 caràcter     #si acaba amb consonant, no trec res i si acaba amb consonant trec 1 caràcter
-    if [[ "`echo ${paraula: -1} | grep [aeiou]`" == "" ]]+    echo ${paraula: -1} 
 +    echo ${paraula: -1} | grep [aeiou] 
 +    if [[ "`echo ${paraula: -1} | grep [aeiouàèìòùáéíóúäëïöüâêîôû]`" == "" ]]
     then     then
 +      echo "edípic-a"
       let resta=0       let resta=0
 +    else
 +      let resta=1
     fi     fi
-  let resta=1 
   elif [ $sufix == "ina" ] || [ $sufix == "una" ] || [ $sufix == "ona" ] || [ $sufix == "ena" ]   elif [ $sufix == "ina" ] || [ $sufix == "una" ] || [ $sufix == "ona" ] || [ $sufix == "ena" ]
   then   then
Line 108: Line 145:
     let resta=(${#sufix}-1)     let resta=(${#sufix}-1)
   fi   fi
- echo $paraula" *"$sufix"*+  if [ $resta -eq 0 ] 
-  echo ${paraula::-${resta}}$sufix" "${paraula}"-"${sufix}>> paraules_amb_sufix+  then 
 +    echo ${paraula}$sufix" "${paraula}"-"${sufix} >> paraules_amb_sufix 
 +  else 
 +    echo ${paraula::-${resta}}$sufix" "${paraula}"-"${sufix} >> paraules_amb_sufix 
 +  fi
 #  echo #  echo
-done < <( grep 'id="Definition"' *0 |awk -F'class="title">|<' '{if ( $8 ~ /^-/ && $5 !~ /^-/ ) printf $5 $8"\n"}' )+done < <( grep 'id="Definition"' *0 |awk -F'class="title">|<' '{if ( $8 ~ /^-/ && $5 !~ /^-/ ) printf $5 $8"\n"}')
  
 while read linea while read linea
Line 119: Line 160:
  
   echo $lnea   echo $lnea
-  torify curl -o definicions_sufix/$linea -X POST --data "DecEntradaText=${linea}" "https://dlc.iec.cat/Results" +  until torify curl -s -o definicions_sufix/$linea -X POST --data "DecEntradaText=${linea}" "https://dlc.iec.cat/Results" 
-done < <(sort paraules_amb_sufix | grep -v "\-a$" | grep -v "\-ana$"|awk {'print $1'}) +  do 
 +    echo "Reiniciando" 
 +    sudo /etc/init.d/tor restart 
 +  done 
 +done < <(cat paraules_amb_sufix |awk {'print $1'})  
 </code> </code>
  
informatica/linux/diccionarios/catala.1646067297.txt.gz · Last modified: 2022/02/28 16:54 by jose