Spaces:

ahmadbeilouni
/

Falcon_testing

Sleeping

App Files Files Community

ahmadbeilouni commited on Aug 5

Commit

0b5c836

verified ·

1 Parent(s): 6dc4749

Update app.py

Browse files

Files changed (1) hide show

app.py +20 -10

app.py CHANGED Viewed

@@ -5,11 +5,12 @@ from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
 # ------------------------------
 # Configuration
 # ------------------------------
-MODEL_NAME = "tiiuae/falcon-7b-instruct"
-MAX_LENGTH = 100
-TEMPERATURE = 0.2
-print("🚀 Loading Falcon 7B for Damascus Real Estate...")
 # ------------------------------
 # Load model and tokenizer
@@ -19,7 +20,8 @@ try:
     model = AutoModelForCausalLM.from_pretrained(
         MODEL_NAME,
         torch_dtype=torch.float16,
-        device_map="auto"
     )
     generator = pipeline(
@@ -30,7 +32,7 @@ try:
         device=0 if torch.cuda.is_available() else -1
     )
-    print("✅ Falcon 7B loaded successfully")
     model_loaded = True
 except Exception as e:
@@ -57,20 +59,28 @@ test_questions = [
 def chat_falcon(user_input):
     if not model_loaded:
         return "❌ النموذج غير محمل. تحقق من الإعدادات."
-    prompt = f"السؤال: {user_input}\nالجواب:"
     output = generator(
         prompt,
         max_new_tokens=MAX_LENGTH,
         do_sample=True,
-        temperature=TEMPERATURE
     )[0]["generated_text"]
-    return output
 # ------------------------------
 # Build Gradio Interface
 # ------------------------------
 with gr.Blocks() as demo:
-    gr.Markdown("## 🏠 Falcon 7B - Damascus Real Estate Test")
     gr.Markdown("اختبر قدرة النموذج على فهم الأسئلة بالعربية (لهجة سورية أو فصحى)")
     with gr.Row():

 # ------------------------------
 # Configuration
 # ------------------------------
+MODEL_NAME = "Malmarz/falcon-7b-arabic-instruct"
+MAX_LENGTH = 120       # safer than 50
+TEMPERATURE = 0.3
+REPETITION_PENALTY = 1.8
+print("🚀 Loading Falcon 7B Arabic Instruct...")
 # ------------------------------
 # Load model and tokenizer
     model = AutoModelForCausalLM.from_pretrained(
         MODEL_NAME,
         torch_dtype=torch.float16,
+        device_map="auto",
+        trust_remote_code=True
     )
     generator = pipeline(
         device=0 if torch.cuda.is_available() else -1
     )
+    print("✅ Falcon 7B Arabic model loaded successfully")
     model_loaded = True
 except Exception as e:
 def chat_falcon(user_input):
     if not model_loaded:
         return "❌ النموذج غير محمل. تحقق من الإعدادات."
+    # Structured prompt for clarity
+    prompt = f"أنت مساعد عقارات ذكي. أجب بجملة أو جملتين واضحتين.\nالسؤال: {user_input}\nالجواب:"
     output = generator(
         prompt,
         max_new_tokens=MAX_LENGTH,
         do_sample=True,
+        temperature=TEMPERATURE,
+        repetition_penalty=REPETITION_PENALTY,
+        top_p=0.9
     )[0]["generated_text"]
+    # Strip the prompt part from the output
+    cleaned_output = output.replace(prompt, "").strip()
+    return cleaned_output
 # ------------------------------
 # Build Gradio Interface
 # ------------------------------
 with gr.Blocks() as demo:
+    gr.Markdown("## 🏠 Falcon 7B Arabic Instruct - Damascus Real Estate Test")
     gr.Markdown("اختبر قدرة النموذج على فهم الأسئلة بالعربية (لهجة سورية أو فصحى)")
     with gr.Row():