Changeset 1773:5e6e42c393a9 in orange-bioinformatics


Ignore:
Timestamp:
05/06/13 21:10:30 (11 months ago)
Author:
markotoplak
Branch:
default
Message:

Small changes to miRNA update scripts. Added title and tags to elements that were missing it.

File:
1 edited

Legend:

Unmodified
Added
Removed
  • server_update/updatemiRNA.py

    r1722 r1773  
    2626        sendMail('Uncorrect format of miRBase data-file.')         
    2727        return False 
     28 
     29IDpat = re.compile('ID\s*(\S*)\s*standard;') 
     30ACpat = re.compile('AC\s*(\S*);') 
     31RXpat = re.compile('RX\s*PUBMED;\s(\d*).') 
     32FT1pat = re.compile('FT\s*miRNA\s*(\d{1,}\.\.\d{1,})') 
     33FT2pat = re.compile('FT\s*/accession="(MIMAT[0-9]*)"') 
     34FT3pat = re.compile('FT\s*/product="(\S*)"') 
     35SQpat = re.compile('SQ\s*(.*other;)') 
     36seqpat = re.compile('\s*([a-z\s]*)\s*\d*') 
     37 
    2838 
    2939     
     
    97107                 
    98108                if r[0:2] == 'ID': 
    99                     preID = str(re.findall('ID\s*(\S*)\s*standard;',r)[0]) 
     109                    preID = str(IDpat.findall(r)[0]) 
    100110                    print preID 
    101111                         
    102112                elif r[0:2] == 'AC': 
    103                     preACC = str(re.findall('AC\s*(\S*);',r)[0]) 
     113                    preACC = str(ACpat.findall(r)[0]) 
    104114                    web_addr = 'http://www.mirbase.org/cgi-bin/mirna_entry.pl?acc=%s' % preACC 
    105115                         
    106                 elif r[0:2] == 'RX' and not(re.findall('RX\s*PUBMED;\s(\d*).',r)==[]): 
    107                     pubIDs.append(str(re.findall('RX\s*PUBMED;\s(\d*).',r)[0])) 
    108                              
    109                 elif r[0:2]=='FT' and not(re.findall('FT\s*miRNA\s*(\d{1,}\.\.\d{1,})',r)==[]): 
    110                     loc_mat = str(re.findall('FT\s*miRNA\s*(\d{1,}\.\.\d{1,})',r)[0]) 
     116                elif r[0:2] == 'RX' and not(RXpat.findall(r)==[]): 
     117                    pubIDs.append(str(RXpat.findall(r)[0])) 
     118 
     119                elif r[0:2]=='FT' and not(FT1pat.findall(r)==[]): 
     120                    loc_mat = str(FT1pat.findall(r)[0]) 
    111121                         
    112122                    if not(loc_mat==[]): 
    113123                         my_locs.append(loc_mat) 
    114124                 
    115                 elif r[0:2]=='FT' and not(re.findall('FT\s*/accession="(MIMAT[0-9]*)"', r)==[]): 
    116                      mat_acc = str(re.findall('FT\s*/accession="(MIMAT[0-9]*)"', r)[0]) 
     125                elif r[0:2]=='FT' and not(FT2pat.findall(r)==[]): 
     126                     mat_acc = str(FT2pat.findall(r)[0]) 
    117127                         
    118128                     if matACCs == '': 
     
    124134                         my_accs.append(mat_acc)     
    125135                                 
    126                 elif r[0:2]=='FT' and not(re.findall('FT\s*/product="(\S*)"', r)==[]): 
    127                      mat_id = str(re.findall('FT\s*/product="(\S*)"', r)[0]) 
     136                elif r[0:2]=='FT' and not(FT3pat.findall(r)==[]): 
     137                     mat_id = str(FT3pat.findall(r)[0]) 
    128138                         
    129139                     if matIDs == '': 
     
    137147                elif r[0:2]=='SQ': 
    138148             
    139                      preSQ_INFO = str(re.findall('SQ\s*(.*other;)', r)[0]) 
     149                     preSQ_INFO = str(SQpat.findall(r)[0]) 
    140150                     seq = 'on' 
    141151             
    142152                elif r[0:2]=='  ' and seq == 'on': 
    143                      preSQ.append(str(re.findall('\s*([a-z\s]*)\s*\d*',r)[0]).replace(' ','')) 
     153                     preSQ.append(str(seqpat.findall(r)[0]).replace(' ','')) 
    144154                      
    145155            ### cluster search 
     
    274284                 
    275285                if type_file == 'mat': 
    276                     serverFiles.upload("miRNA", label, filename, title="miRNA: %s mature form" % org, tags=["tag1", "tag2"]) 
     286                    serverFiles.upload("miRNA", label, filename, title="miRNA: %s mature form" % org, tags=["miRNA"]) 
    277287                    serverFiles.unprotect("miRNA", label) 
    278288                    print '%s mat uploaded' % org 
     
    282292                     
    283293                elif type_file == 'pre': 
    284                     serverFiles.upload("miRNA", label, filename, title="miRNA: %s pre-form" % org, tags=["tag1", "tag2"]) 
     294                    serverFiles.upload("miRNA", label, filename, title="miRNA: %s pre-form" % org, tags=["miRNA"]) 
    285295                    serverFiles.unprotect("miRNA", label) 
    286296                    print '%s pre uploaded' % org 
     
    292302                    print 'Check the label.' 
    293303     
    294     serverFiles.upload("miRNA", "miRNA.txt", miRNA_path) 
     304    serverFiles.upload("miRNA", "miRNA.txt", miRNA_path, title="miRNA: miRNA library", tags=["miRNA"] ) 
    295305    serverFiles.unprotect("miRNA", "miRNA.txt") 
    296306    print '\nmiRNA.txt uploaded' 
    297307     
    298     serverFiles.upload("miRNA", "premiRNA.txt", premiRNA_path) 
     308    serverFiles.upload("miRNA", "premiRNA.txt", premiRNA_path, title="miRNA: pre-form library", tags=["miRNA"]) 
    299309    serverFiles.unprotect("miRNA", "premiRNA.txt") 
    300310    print 'premiRNA.txt uploaded\n' 
Note: See TracChangeset for help on using the changeset viewer.