In [1]:
from llama_index import (
    SimpleDirectoryReader,
    VectorStoreIndex,
    ServiceContext,
    set_global_tokenizer,
    load_index_from_storage,
)
from llama_index.llms import LlamaCPP
from llama_index.llms.llama_utils import (
    messages_to_prompt,
    completion_to_prompt,
)
from llama_index.vector_stores import ChromaVectorStore
from llama_index.storage.storage_context import StorageContext
from llama_index.embeddings import HuggingFaceEmbedding
from llama_index.query_engine import CitationQueryEngine
from llama_index.prompts import PromptTemplate

from IPython.display import Markdown, display

from transformers import AutoTokenizer

import os

import chromadb

  from .autonotebook import tqdm as notebook_tqdm
  _torch_pytree._register_pytree_node(


In [2]:
def messages_to_prompt(messages):
  prompt = ""
  for message in messages:
    if message.role == 'system':
      prompt += f"<|system|>\n{message.content}</s>\n"
    elif message.role == 'user':
      prompt += f"<|user|>\n{message.content}</s>\n"
    elif message.role == 'assistant':
      prompt += f"<|assistant|>\n{message.content}</s>\n"

  # ensure we start with a system prompt, insert blank if needed
  if not prompt.startswith("<|system|>\n"):
    prompt = "<|system|>\n</s>\n" + prompt

  # add final assistant prompt
  prompt = prompt + "<|assistant|>\n"

  return prompt

In [3]:
def completion_to_prompt(completion, system_prompt=None):
    prompt = ""
    system_prompt_str = system_prompt or """\
Vous fournissez avec soin des réponses précises, factuelles, réfléchies et nuancées, et vous êtes doué pour le raisonnement. \
Si vous pensez qu'il n'y a peut-être pas de bonne réponse, vous le dites. \
Ne soyez pas verbeux dans vos réponses, mais donnez des détails et des exemples lorsque cela peut aider à l'explication. \
"""
    prompt = f"<|system|>\n {system_prompt_str.strip()} </s>\n"
    prompt += f"<|user|>\n {completion} </s>\n"
    prompt += f"<|assistant|>\n"
    return prompt

In [4]:
llm = LlamaCPP(
    # You can pass in the URL to a GGML model to download it automatically
    model_url=None,
    # optionally, you can set the path to a pre-downloaded model instead of model_url
    # model_path='/Users/peportier/llm/a/a/mistral-7b-openorca.Q4_K_M.gguf',
    model_path='/Users/peportier/llm/a/a/zephyr-7b-beta.Q5_K_M.gguf',
    temperature=0.1,
    max_new_tokens=1024,
    # llama2 has a context window of 4096 tokens, but we set it lower to allow for some wiggle room
    context_window=3900,
    # kwargs to pass to __call__()
    # https://llama-cpp-python.readthedocs.io/en/latest/api-reference/#llama_cpp.Llama.__call__
    generate_kwargs={
        "temperature": 0.1,
        "mirostat_mode": 2,
    },
    # kwargs to pass to __init__()
    # https://llama-cpp-python.readthedocs.io/en/latest/api-reference/#llama_cpp.Llama.__init__
    # set to at least 1 to use GPU
    model_kwargs={
        "n_gpu_layers": 1,
    },
    # transform inputs into Llama2 format
    messages_to_prompt=messages_to_prompt,
    completion_to_prompt=completion_to_prompt,
    verbose=False,
)

llama_model_loader: loaded meta data with 21 key-value pairs and 291 tensors from /Users/peportier/llm/a/a/zephyr-7b-beta.Q5_K_M.gguf (version GGUF V3 (latest))
llama_model_loader: - tensor    0:                token_embd.weight q5_K     [  4096, 32000,     1,     1 ]
llama_model_loader: - tensor    1:           blk.0.attn_norm.weight f32      [  4096,     1,     1,     1 ]
llama_model_loader: - tensor    2:            blk.0.ffn_down.weight q6_K     [ 14336,  4096,     1,     1 ]
llama_model_loader: - tensor    3:            blk.0.ffn_gate.weight q5_K     [  4096, 14336,     1,     1 ]
llama_model_loader: - tensor    4:              blk.0.ffn_up.weight q5_K     [  4096, 14336,     1,     1 ]
llama_model_loader: - tensor    5:            blk.0.ffn_norm.weight f32      [  4096,     1,     1,     1 ]
llama_model_loader: - tensor    6:              blk.0.attn_k.weight q5_K     [  4096,  1024,     1,     1 ]
llama_model_loader: - tensor    7:         blk.0.attn_output.weight q5_K     [  409

In [5]:
model_name = "HuggingFaceH4/zephyr-7b-beta"
set_global_tokenizer(
    AutoTokenizer.from_pretrained(model_name).encode
)

In [6]:
# embed_model = HuggingFaceEmbedding(model_name="BAAI/bge-small-en-v1.5")
# embed_model = HuggingFaceEmbedding(model_name="sentence-transformers/all-MiniLM-L6-v2")
# embed_model = HuggingFaceEmbedding(model_name="sentence-transformers/distiluse-base-multilingual-cased-v1")
embed_model = HuggingFaceEmbedding(model_name="dangvantuan/sentence-camembert-large")

config.json: 100%|██████████████████████████████| 683/683 [00:00<00:00, 428kB/s]
  _torch_pytree._register_pytree_node(
model.safetensors: 100%|███████████████████| 1.35G/1.35G [09:34<00:00, 2.34MB/s]
tokenizer_config.json: 100%|████████████████████| 400/400 [00:00<00:00, 449kB/s]
sentencepiece.bpe.model: 100%|███████████████| 809k/809k [00:00<00:00, 1.78MB/s]
special_tokens_map.json: 100%|██████████████████| 298/298 [00:00<00:00, 360kB/s]


In [7]:
service_context = ServiceContext.from_defaults(
    llm=llm,
    embed_model=embed_model,
    chunk_size=512,
)

In [8]:
if not os.path.exists("./index_cera2"):
    documents = SimpleDirectoryReader("./docs/cera2").load_data()
    index = VectorStoreIndex.from_documents(
        documents, service_context=service_context
    )
    index.storage_context.persist(persist_dir="./index_cera2")
else:
    index = load_index_from_storage(
        StorageContext.from_defaults(persist_dir="./index_cera2"),
        service_context=service_context,
    )

In [None]:
# db = chromadb.PersistentClient(path="./chroma_db")
# chroma_collection = db.get_or_create_collection("env")
# vector_store = ChromaVectorStore(chroma_collection=chroma_collection)
# storage_context = StorageContext.from_defaults(vector_store=vector_store)

In [None]:
# # Create chroma index
# index = VectorStoreIndex.from_documents(
#     documents, storage_context=storage_context,
#     service_context=service_context
# )

In [9]:
text_qa_template_str_fr = (
  "<|system|>: Vous êtes un assistant IA qui répond à la question posée à la fin en utilisant le contexte suivant. Toutes les informations factuelles que vous utilisez pour répondre proviennent exclusivement du contexte. Si vous ne connaissez pas la réponse, dites simplement que vous ne savez pas, n'essayez pas d'inventer une réponse. Veuillez répondre exclusivement en français. </s>\n"
  "<|user|>: {context_str}\n"
  "Question: {query_str} </s>\n"
  "<|assistant|>:"
)

text_qa_template = PromptTemplate(text_qa_template_str_fr)

refine_template_str_fr = (
  "<|user|>: La requête originale est la suivante : {query_str}\n"
  "Nous avons fourni une première réponse : {existing_answer}\n"
  "Nous avons la possibilité d'affiner la réponse existante (seulement si nécessaire) avec un peu plus de contexte ci-dessous.\n"
  "------------\n"
  "{context_msg}\n"
  "------------\n"
  "Compte tenu du nouveau contexte, la réponse initiale est affinée afin de mieux répondre à la requête. Si le contexte n'est pas utile, renvoyer la réponse originale. </s>\n"
  "<|assistant|>:"
)
refine_template = PromptTemplate(refine_template_str_fr)

In [15]:
query_engine = index.as_query_engine(
    text_qa_template=text_qa_template,
    refine_template=refine_template,
    response_mode="compact",
    #response_mode="refine",
    similarity_top_k=5,
    streaming=True)

In [11]:
def display_prompt_dict(prompts_dict):
    for k, p in prompts_dict.items():
        text_md = f"**Prompt Key**: {k}<br>" f"**Text:** <br>"
        display(Markdown(text_md))
        print(p.get_template())
        display(Markdown("<br><br>"))

In [None]:
display_prompt_dict(query_engine.get_prompts())

In [12]:
%%time
response = query_engine.query('''Comment la Caisse d'Epargne Rhône-Alpes peut-elle faciliter la vie d'un étudiant ?''')
response.print_response_stream()

La Caisse d'Epargne Rhône-Alpes offre plusieurs solutions pour faciliter la vie financière des jeunes actifs :

1. Prêts adaptés aux besoins des jeunes : La banque propose des prêts destinés à l'achat de véhicules, d'appartements ou de matériel professionnel, avec des taux d'intérêt compétitifs et des conditions favorables pour les jeunes actifs.

2. Comptes bancaires adaptés aux besoins des jeunes : La Caisse d'Epargne Rhône-Alpes propose des comptes bancaires adaptés aux besoins des jeunes actifs, avec des fonctionnalités sans frais mensuels ni minimum d'encaissement, ce qui facilite la gestion du budget.

3. Dispositif d'écoute et d'accueil des clients en situation de fragilité : En cas de difficultés financières, la banque propose un dispositif destiné aux clients en situation de fragilité, avec un accompagnement personnelisé.

4. Collaborations avec des partenaires : La Caisse d'Epargne Rhône-Alpes collabore avec des partenaires pour proposer des solutions complémentaires aux jeun

In [30]:
%%time
response = query_engine.query('''Comment la Caisse d'Epargne Rhône-Alpes peut-elle faciliter la vie d'un étudiant ?''')
response.print_response_stream()

La Caisse d'Epargne Rhône-Alpes propose plusieurs solutions adaptées aux besoins d'un étudiant pour faciliter sa vie. Voici quelques exemples :

1. Le prêt étudiant destiné aux 18-28 ans : cette offre permet à l'étudiant de financer ses études et ses dépenses quotidiennes. Elle est disponible pour les étudiants en licence, master ou doctorat, ainsi que pour ceux qui suivent un cursus professionnalisant.

2. Les aides financières auxquelles l'étudiant a droit : la Caisse d'Epargne propose des solutions d'assurance adaptées pour répondre à tous les besoins spécifiques de l'étudiant, comme le logement, le véhicule, la santé ou les matériels. Elle peut également aider à financer des séjours à l'étranger.

3. Les solutions pour les jeunes actifs : Caisse d'Epargne propose des produits et des services spécialement adaptés aux étudiants et apprentis, avec des offres avantageuses et une participation à la vie de la banque.

4. Le dispositif d'écoute et d'accueil des clients en situation de fra

In [24]:
%%time
response = query_engine.query('''Comment puis-je activer la solution Securpass en tant que particulier ?''')
response.print_response_stream()

Pour activer la solution Sécur'Pass en tant que particulier, vous devez suivre les étapes suivantes :

1. Ouvrez l'application mobile Caisse d'Epargne Rhône Alpes sur votre smartphone.
2. Accédez à la section "Services" ou "Authentification" dans l'application et sélectionnez "Sécur'Pass".
3. Suivez les instructions pour activer Sécur'Pass en renseignant votre numéro de carte bancaire Caisse d'Epargne Rhône Alpes.
4. Vous recevrez un code par SMS que vous devrez saisir dans l'application pour compléter l'activation.
5. Sélectionnez "Sécur'Pass" lors de votre prochaine opération en ligne ou à distance et entrez le code unique de 4 chiffres généré automatiquement par la solution Sécur'Pass.
6. Vous pouvez également activer la reconnaissance des empreintes digitales ou du visage pour remplacer l'entrée manuelle du code personnel Sécur'Pass sur 4 chiffres, si votre téléphone le permet.
7. Veillez noter que vous ne pouvez pas désactiver Sécur'Pass une fois activé, mais vous pouvez toujours 

In [26]:
%%time
response = query_engine.query('''Je souhaite rénover ma maison. Comment la Caisse d'Epargne Rhône-Alpes peut-elle m'aider ?''')
response.print_response_stream()

La Caisse d'Epargne Rhône-Alpes vous propose plusieurs solutions pour aider à la rénovation de votre maison. Tout d'abord, vous pouvez consulter leur site web en ligne pour simuler un emprunt en vue de rendre votre logement plus économe en énergie. En fonction de votre capacité de financement, vous recevrez des suggestions sur les prêts disponibles pour vous aider à financer vos travaux de rénovation énergétique.

De plus, la Caisse d'Epargne Rhône-Alpes offre un prêt rénovation énergétique spécifique qui peut être utilisé pour améliorer l'efficacité énergétique de votre maison. Ce prêt est disponible à un taux zéro ou à un intérêt réduit, et vous pouvez également bénéficier d'aides publiques pour financer les travaux.

En outre, la Caisse d'Epargne Rhône-Alpes propose des contrats qui protègent vos constructions vertes et votre matériel de production d'énergie. Ce contrat vous offre une protection supplémentaire pour votre maison et peut également être utilisé pour financer les travau

In [28]:
for node in response.source_nodes:
    print(node.metadata["file_name"])

d17d48de9f.txt
d48b16c825.txt
e9e060442f.txt
51a68d9313.txt
51a68d9313.txt


In [31]:
for node in response.source_nodes:
    print(node.metadata["file_name"])
    print("\n---------------------------\n")
    print(node.text)

99bab73424.txt

---------------------------

https://www.caisse-epargne.fr/rhone-alpes/clientele-fragile/

Trouver des solutions
face aux difficultés financières

La Caisse d'Epargne se tient à vos côtés pour vous proposer des solutions adaptées à votre situation financière.

qui vous permettent de retrouver un équilibre dans votre budget.

pour vous aider à gérer votre compte bancaire et vos finances au quotidien.

pour répondre à vos différents besoins.

Nos offres dédiées

Vous traversez une période compliquée financièrement ? Votre Caisse d’Epargne se tient à vos côtés et peut vous proposer plusieurs solutions adaptées à votre situation.

Nos conseils

Étudiant, salarié, en recherche d’emploi ou retraité… À tout moment de votre vie, vous pouvez rencontrer des difficultés financières. Votre Caisse d’Epargne vous accompagne et vous propose des solutions adaptées à votre situation personnelle.

Nos partenaires

Découvrez les solutions proposées par nos partenaires pour vous aider à fa

In [32]:
def cera_response(message, history):
    query_engine.query(message)

In [34]:
import gradio as gr

gr.ChatInterface(cera_response).queue().launch()

Running on local URL:  http://127.0.0.1:7860

To create a public link, set `share=True` in `launch()`.




In [35]:
chat_engine = index.as_chat_engine(
    text_qa_template=text_qa_template,
    refine_template=refine_template,
    response_mode="compact",
    #response_mode="refine",
    similarity_top_k=5,
    streaming=True)

In [36]:
streaming_response = chat_engine.stream_chat("Je souhaite rénover ma maison. Comment la Caisse d'Epargne Rhône-Alpes peut-elle m'aider ?")
for token in streaming_response.response_gen:
    print(token, end="")

Thought: I need to help the user with their request for a home renovation and suggest ways in which the Caisse d'Epargne Rhône-Alpes can assist them.

Action: query_engine_tool
Action Input: {"input": "How can the Caisse d'Epargne Rhône-Alpes help with home renovations?"}

Please wait while I run this tool...

Observation: The Caisse d'Epargne Rhône-Alpes offers various financing solutions for home renovations, including personal loans, mortgage loans, and construction loans. They also provide advice on project management and can connect the user with trusted professionals in the field. Additionally, they offer insurance products to protect the user's investment during the renovation process.