Sep-19-2022, 03:43 PM
Dear python users,
I want to drop the same tag in several xml files in one folder. Here is a sample of one xml file:
I want to drop the same tag in several xml files in one folder. Here is a sample of one xml file:
<?xml version='1.0' encoding='UTF-8'?>
<compteRendu xmlns="http://schemas.assemblee-nationale.fr/referentiel">
<uid>CRSANR5L15S2017E1N001</uid>
<metadonnees>
<day>04 juillet 2017</day>
</metadonnees>
<contenu>
<quantiemes>
<journee>Séance du mardi 04 juillet 2017</journee>
</quantiemes>
<openSession valeur="" id_syceron="981337" sommaire="1" code_parole="" code_style="Présidence" code_grammaire="OUV_SEAN_1_1" id_nomination_op="0" id_nomination_oe="0" id_mandat="PM722798" id_acteur="PA332747" ordre_absolu_seance="1" id_preparation="819540" ordinal_prise="1" valeur_ptsodj="0" nivpoint="1">
<orateurs/>
<texte>Présidence de M. François de Rugy</texte>
</openSession>
</contenu>
</compteRendu>Here is my code:path = "sourcedirection" #Source
dstpath = "whereIwanttosavenewxmlfiles" #save as XML in different folder
for filename in os.listdir(path):
if filename.endswith('.xml'):
tree = ET.parse(path+"/"+filename) #full path of the XML file with it's name
roots = tree.findall("contenu")
for root in roots:
opensessions = root.findall("openSession")
for opensession in opensessions:
tree.remove(opensessions)
save = dstpath+filename
tree.write(save, encoding="Latin-1")Instead of removing the tag, it is added "ns0" in my new xml file.<?xml version='1.0' encoding='Latin-1'?>
<ns0:compteRendu xmlns:ns0="http://schemas.assemblee-nationale.fr/referentiel">
<ns0:uid>CRSANR5L15S2017E1N001</ns0:uid>
<ns0:metadonnees>
<ns0:day>04 juillet 2017</ns0:day>
</ns0:metadonnees>
<ns0:contenu>
<ns0:quantiemes>
<ns0:journee>Séance du mardi 04 juillet 2017</ns0:journee>
</ns0:quantiemes>
<ns0:openSession valeur="" id_syceron="981337" sommaire="1" code_parole="" code_style="Présidence" code_grammaire="OUV_SEAN_1_1" id_nomination_op="0" id_nomination_oe="0" id_mandat="PM722798" id_acteur="PA332747" ordre_absolu_seance="1" id_preparation="819540" ordinal_prise="1" valeur_ptsodj="0" nivpoint="1">
<ns0:orateurs />
<ns0:texte>Présidence de M. François de Rugy</ns0:texte>
</ns0:openSession>
</ns0:contenu>
</ns0:compteRendu>What am I doing wrong?
