Version 1. Very good. The dictionaries are compared, and the diacritics from the first dictionary are included in the output.
import tkinter as tk
import re
from tkinter import messagebox, simpledialog
from unidecode import unidecode # Importați unidecode
# Presupunem că avem următoarele liste:
dictionar = ["înţeleasă", "Eului", "misterului"] # și așa mai departe
dictionar_2 = ["inteleasa", "Eului", "misterului"] # și așa mai departe
text = "Fiind inteleasa identitate dintre planul Eului ... " # și așa mai departe
# Parcurgem fiecare cuvânt din dictionar_2
for idx, cuvant in enumerate(dictionar_2):
# Înlocuim cuvântul fără diacritice cu cel cu diacritice
text = text.replace(cuvant, dictionar[idx])
print(text)In the following code, I want to do the same thing as in the first code, only by extracting data from .txt that contain the same words:import tkinter as tk
import re
from tkinter import messagebox, simpledialog
from unidecode import unidecode # Importați unidecode
# Citim cuvintele din dictionar.txt
with open('dictionar.txt', 'r', encoding='utf-8') as f:
dictionar = f.read().splitlines()
# Citim cuvintele din dictionar-2.txt
with open('dictionar-2.txt', 'r', encoding='utf-8') as f:
dictionar_2 = f.read().splitlines()
text = "Fiind inteleasa identitate dintre planul Eului ... " # și așa mai departe
# Parcurgem fiecare cuvânt din dictionar_2
for idx, cuvant in enumerate(dictionar_2):
# Verificăm dacă cuvântul fără diacritice există în text
if cuvant in text:
# Înlocuim cuvântul fără diacritice cu cel cu diacritice
text = text.replace(cuvant, dictionar[idx])
print(f"Înlocuit {cuvant} cu {dictionar[idx]}")
print("Textul inițial:", "Fiind inteleasa identitate dintre planul Eului ... ")
print("Textul final:", text)In dictionary.txt I have the words:Fiind, înţeleasă, identitate, dintre, planul, Eului, cel, misterului, substanţa, creaţiei, întemeiază, proces, simbolizare, realităţii, cuprinse, specifice, zonei, aflu, scoici, fosile, melci, alge, aduse, ţărm, bucăţele, sticlă, mării, şlefuieşte, timp, şezlonguri, umbrele, vânzători, ambulanți, activități, nautice, șiIn dictionary-2.txt I have the same words, but without diacritics:
Fiind, inteleasa, identitate, dintre, planul, Eului, cel, misterului, substanta, creatiei, intemeiaza, proces, simbolizare, realitatii, cuprinse, specifice, zonei, aflu, scoici, fosile, melci, alge, aduse, tarm, bucatele, sticla, marii, slefuieste, timp, sezlonguri, umbrele, vanzatori, ambulanti, activitati, nautice, siThe output should be: (word "înţeleasă" with diacritics)
Fiind înţeleasă identitate dintre planul Eului
