Conversion du dump vers une base de données SQL.
This commit is contained in:
parent
85bfa56d06
commit
5d805ac25d
3
code/serveur/.gitignore
vendored
Normal file
3
code/serveur/.gitignore
vendored
Normal file
|
@ -0,0 +1,3 @@
|
|||
01042011-LEXICALNET-JEUXDEMOTS-FR-NOHTML.txt
|
||||
db
|
||||
sql
|
31
code/serveur/dump2sql.sh
Normal file
31
code/serveur/dump2sql.sh
Normal file
|
@ -0,0 +1,31 @@
|
|||
#!/bin/sh
|
||||
|
||||
echo " dump2sql.sh : conversion des dumps de JeuxDeMots vers du sql (sqlite3)." >&2
|
||||
echo " La progression est affichée avec pv. Si vous n'avez pas pv, supprimez la ligne correspondante dans ce script." >&2
|
||||
echo " Et c'est parti !" >&2
|
||||
echo >&2
|
||||
|
||||
cat <<EOF
|
||||
begin transaction;
|
||||
create table node(eid integer primary key autoincrement, name, type, weight);
|
||||
create table relation(rid integer primary key autoincrement, start, end, type, weight);
|
||||
create table type_node(nom, num);
|
||||
create table type_relation(nom, num, nom_etendu, info);
|
||||
EOF
|
||||
|
||||
# tr : pour virer le CRLF qui traîne
|
||||
# Le gros tas de sed / tr : pour virer le newline dans une des description étendue
|
||||
cat "$1" \
|
||||
| iconv -f iso-8859-1 -t utf-8 \
|
||||
| tr '\r' ' ' \
|
||||
| sed -e 's/X/XX/g' | sed -e 's/A/Xa/g' | tr '\n' 'A' | sed -e 's/A")/")/g' | tr 'A' '\n' | sed -e 's/Xa/A/g' | sed -e 's/XX/X/g' \
|
||||
| pv -s $(wc -c "$1" | cut -d ' ' -f 1) \
|
||||
| sed -e "s#'#''#g" \
|
||||
| sed -E -e 's#^// [0-9]+ occurrences of relations ([a-z_]+) \(t=([0-9]+) nom_etendu="([^"]+)" info="([^"]+)"\)$#insert into type_relation(nom, num, nom_etendu, info) values('\''\1'\'', \2, '\''\3'\'', '\''\4'\'');#' \
|
||||
| sed -E -e 's#^// [0-9]+ occurrences of nodes ([a-z_]+) \(t=([0-9]+)\)$#insert into type_node(nom, num) values('\''\1'\'', \2);#' \
|
||||
| sed -E -e 's#^eid=([0-9]+):n="(.*)":t=([0-9]+):w=(-?[0-9]+)$#insert into node(eid, name, type, weight) values(\1, '\''\2'\'', '\''\3'\'', '\''\4'\'');#' \
|
||||
| sed -E -e 's#^rid=([0-9]+):n1=([0-9]+):n2=([0-9]+):t=([0-9]+):w=(-?[0-9]+)#insert into relation(rid, start, end, type, weight) values(\1,\2,\3,\4,\5);#' \
|
||||
| grep -v '^//' \
|
||||
| grep -v '^$'
|
||||
|
||||
echo "commit;"
|
|
@ -5,8 +5,8 @@
|
|||
\usepackage[utf8]{inputenc}
|
||||
\usepackage{um2/um2}
|
||||
|
||||
\title{Rapport de bablabla\\---\\Projet machinchose}
|
||||
\author{Truc \textsc{Machinchose} \and Blop \textsc{Fubar}}
|
||||
\title{Rapport de TER\\---\\Reconception du jeu Pticlic sous Android}
|
||||
\author{Yoann \textsc{Bonavero} \and Bertrand \textsc{Brun} \and John \textsc{Charron} \and Georges \textsc{Dupéron}}
|
||||
|
||||
\begin{document}
|
||||
|
||||
|
@ -15,7 +15,14 @@
|
|||
\tableofcontents
|
||||
\newpage
|
||||
|
||||
\section{Première section}
|
||||
\section{Difficultés rencontrées}
|
||||
\subsection{Itération 1, semaine 1}
|
||||
\begin{itemize}
|
||||
\item Outil de création de diagrammes de GANTT (planner) est assez mauvais.
|
||||
\item Lenteur de l'émulateur Android : impossible de travailler sur mon PC.% gd
|
||||
\item Caractères non échappés dans le dump de la base.% gd
|
||||
\end{itemize}
|
||||
|
||||
\section{Deuxième section}
|
||||
\section{Troisième section}
|
||||
\newpage
|
||||
|
|
Loading…
Reference in New Issue
Block a user