Is there difference between embedding text and tiktoken

mbabayev · September 30, 2023, 5:39pm

Is there difference between embedding text and tokens (res1 vs res2)? The embedding result is not deterministic. That’s why even the same code run twice will produce different vectors. Are these 2 requests produce similar embedding vectors?

res1 = openai.Embedding.create(input=['Hi! How are you?'], model=EMBEDDINGS_MODEL)
res1 = res1['data'][0]['embedding']

encoding = tiktoken.get_encoding("cl100k_base")
res = encoding.encode('Hi! How are you?')
res2 = openai.Embedding.create(input=[res], model=EMBEDDINGS_MODEL)
res2 = res2['data'][0]['embedding']

Topic		Replies	Views
What is difference between GPT2 and GPT3 tokenizers? API	1	1118	February 21, 2024
Inconsistent embedding result with same input API	4	830	December 24, 2023
Does embeddings API return token level embeddings? API	1	660	April 3, 2023
Token number inconsistent between API and ChatGPT API embeddings	1	526	August 23, 2023
Does openAI provide API that takes Embeddings as an input? API embeddings	10	1912	December 18, 2023

Is there difference between embedding text and tiktoken

Related Topics