sqlalchemy_play.py

import sqlalchemy
import clarity_to_csv as ctc

#from sqlalchemy import create_engine
sqlalchemy.__version__
#%%
sqlite_db_filepath = "C:\\Users\\LynchSe\\Documents\\Data\\database.db"
e = sqlalchemy.create_engine('sqlite:///{}'.format(sqlite_db_filepath))
conn = e.connect()
#%%
eng_clarity = ctc.get_clarity_engine()
conn_clarity = eng_clarity.connect()

#%%

metadata_obj = sqlalchemy.MetaData()

#%%
mytable = sqlalchemy.schema.Table("mytable", metadata_obj,
                sqlalchemy.Column('mytable_id', sqlalchemy.Integer, primary_key=True),
                sqlalchemy.Column('value', sqlalchemy.String(50))
           )
mytable.name
#%%  HOLY SHIT, I CAN READ INFO ABOUT A TABLE FROM CLARITY!!!

pat_enc = sqlalchemy.Table('PAT_ENC', metadata_obj, autoload_with=eng_clarity)
list(pat_enc.columns)

#%%  Can I easily import a cohort into clarity?

cohort = sqlalchemy.schema.Table("##cohort", metadata_obj,
                sqlalchemy.Column('PAT_ID', sqlalchemy.String(18), primary_key=True))
#%%
cohort.create(eng_clarity)
#%%
stmt = sqlalchemy.insert(cohort).values(PAT_ID='5931')
eng_clarity.execute(stmt)
#%%
rows = [{'PAT_ID':'1132'}, {'PAT_ID':'1133'}]
stmt = sqlalchemy.insert(cohort).values(rows)
eng_clarity.execute(stmt)

#TODO - test if this can handle a gazillion rows without being super slow
#%%
stmt = sqlalchemy.select(cohort)
res = eng_clarity.execute(stmt)
#%%
import pandas as pd
df = pd.read_sql(stmt, eng_clarity)

df2 = pd.read_sql(stmt.where(cohort.c.PAT_ID < 2000), eng_clarity)

df3 = pd.read_sql(stmt.where(cohort.c.PAT_ID.in_([5931, 1132])), eng_clarity)

#%% now how do I select from PAT_ENC based on a list of ids
#TODO - import into temp table and use join
#TODO - compare with IN clause?