source: orange-bioinformatics/_bioinformatics/widgets/OWGeneInfo.py @ 1726:6778e0225b86

Revision 1726:6778e0225b86, 23.6 KB checked in by Ales Erjavec <ales.erjavec@…>, 17 months ago (diff)

Added new icons by Peter Cuhalev and replaced existing ones with expanded paths.

Line 
1"""
2<name>Gene Info</name>
3<description>Displays gene information from NCBI and other sources.</description>
4<priority>2010</priority>
5<contact>Ales Erjavec (ales.erjavec(@at@)fri.uni-lj.si)</contact>
6<icon>icons/GeneInfo.svg</icon>
7"""
8
9from __future__ import absolute_import, with_statement
10
11from collections import defaultdict
12from functools import partial
13
14import orange
15from Orange.orng import orngServerFiles
16from Orange.orng.orngDataCaching import data_hints
17from Orange.OrangeWidgets import OWGUI
18from Orange.OrangeWidgets.OWWidget import *
19
20from .. import obiGene, obiTaxonomy
21
22class TreeModel(QAbstractItemModel):
23    def __init__(self, data, header, parent):
24        QAbstractItemModel.__init__(self, parent)
25        self._data = [[QVariant(s) for s in row] for row in data]
26        self._dataDict = {}
27        self._header = header
28        self._roleData = {Qt.DisplayRole:self._data}
29        self._roleData = partial(defaultdict, partial(defaultdict, partial(defaultdict, QVariant)))(self._roleData)
30   
31    def setColumnLinks(self, column, links):
32        font =QFont()
33        font.setUnderline(True)
34        font = QVariant(font)
35        for i, link in enumerate(links):
36            self._roleData[LinkRole][i][column] = QVariant(link)
37            self._roleData[Qt.FontRole][i][column] = font
38            self._roleData[Qt.ForegroundRole][i][column] = QVariant(QColor(Qt.blue))
39   
40    def setRoleData(self, role, row, col, data):
41        self._roleData[role][row][col] = data
42       
43    def data(self, index, role=Qt.DisplayRole):
44        row, col = index.row(), index.column()
45        return self._roleData[role][row][col]
46       
47    def index(self, row, col, parent=QModelIndex()):
48        return self.createIndex(row, col, 0)
49   
50    def parent(self, index):
51        return QModelIndex()
52   
53    def rowCount(self, index=QModelIndex()):
54        if index.isValid():
55            return 0
56        else:
57            return len(self._data)
58       
59    def columnCount(self, index=QModelIndex()):
60        return len(self._header)
61
62    def headerData(self, section, orientation, role=Qt.DisplayRole):
63        if role==Qt.DisplayRole:
64            return QVariant(self._header[section])
65        return QVariant()
66
67from Orange.OrangeWidgets.OWGUI import LinkStyledItemDelegate, LinkRole
68
69def lru_cache(maxsize=100):
70    """ A least recently used cache function decorator.
71    """
72   
73    def decorating_function(func):
74        import functools
75        cache = {}
76       
77        functools.wraps(func)
78        def wrapped(*args, **kwargs):
79            key = args + tuple(sorted(kwargs.items()))
80            if key not in cache:
81                res = func(*args, **kwargs)
82                cache[key] = (time.time(), res)
83                if len(cache) > maxsize:
84                    key, (_, _) = min(cache.iteritems(), key=lambda item: item[1][0])
85                    del cache[key]
86            else:
87                _, res = cache[key]
88                cache[key] = (time.time(), res) # update the time
89               
90            return res
91       
92        def clear():
93            cache.clear()
94       
95        wrapped.clear = clear
96       
97        return wrapped
98    return decorating_function
99               
100class LinkFmt(object):
101    def __init__(self, link_fmt, name):
102        self.link_fmt = link_fmt
103        self.name = name
104       
105    def format(self, *args, **kwargs):
106        return Link(self.link_fmt.format(*args, **kwargs), **kwargs)
107   
108    def __repr__(self):
109        return "<LinkFmt " + repr(self.name) + " >"
110   
111    def __str__(self):
112        return self.name
113   
114class Link(object):
115    def __init__(self, link, text=None, **kwargs):
116        self.link = link
117        self.text = text if text is not None else "link"
118        self.__dict__.update(kwargs)
119       
120    def str(self):
121        return link
122   
123   
124@lru_cache(maxsize=2)
125def get_ncbi_info(taxid):
126    return obiGene.NCBIGeneInfo(taxid)
127
128def ncbi_info(taxid, genes):
129    info = get_ncbi_info(taxid)
130    schema_link = LinkFmt("http://www.ncbi.nlm.nih.gov/sites/entrez?Db=gene&Cmd=ShowDetailView&TermToSearch={gene_id}", name="NCBI ID")
131    schema = [schema_link, "Symbol", "Locus Tag", "Chromosome",
132              "Description", "Synonyms", "Nomenclature"]
133    ret = []
134    for gene in genes:
135        gi = info.get_info(gene)
136        if gi:
137            ret.append([schema_link.format(gene_id=gi.gene_id, text=gi.gene_id),
138                        gi.symbol + " (%s)" % gene if gene != gi.symbol else gi.symbol,
139                        gi.locus_tag or "",
140                        gi.chromosome or "",
141                        gi.description or "",
142                        ", ".join(gi.synonyms),
143                        gi.symbol_from_nomenclature_authority or ""
144                        ])
145        else:
146            ret.append(None)
147    return schema, ret
148   
149def dicty_info(taxid, genes):
150    from .. import obiDicty
151    info = obiDicty.DictyBase()
152    name_matcher = obiGene.GMDicty()
153    name_matcher.set_targets(info.info.keys())
154    schema_link = LinkFmt("http://dictybase.org/db/cgi-bin/gene_page.pl?dictybaseid={gene_id}", name="Dicty Base Id")
155    schema = [schema_link, "Name", "Synonyms", "Gene Products"]
156   
157    ret = []
158    for gene in genes:
159        gene = name_matcher.umatch(gene)
160        gi = info.info.get(gene, None)
161        if gi:
162            ret.append([schema_link.format(gene_id=gene, text=gene),
163                        gi[0] + " (%s)" % gene if gene != gi[0] else gi[0], # Gene Name
164                        ", ".join(gi[1]), # Synonyms
165                        gi[2] or "", # Gene Products
166                        ])
167           
168        else:
169            ret.append(None)
170   
171    return schema, ret
172   
173   
174INFO_SOURCES = {"default": [("NCBI Info", ncbi_info)],
175                "352472": [("NCBI Info", ncbi_info),
176                           ("Dicty Base", dicty_info)
177                           ]
178                }
179
180class OWGeneInfo(OWWidget):
181    settingsList = ["organismIndex", "geneAttr", "useAttr", "autoCommit"]
182    contextHandlers = {"":DomainContextHandler("", ["organismIndex",
183                                "geneAttr", "useAttr", "useAltSource"])}
184    def __init__(self, parent=None, signalManager=None, name="Gene Info"):
185        OWWidget.__init__(self, parent, signalManager, name)
186
187        self.inputs = [("Examples", ExampleTable, self.setData)]
188        self.outputs = [("Selected Examples", ExampleTable)]
189
190        self.organismIndex = 0
191        self.geneAttr = 0
192        self.useAttr = False
193        self.autoCommit = False
194        self.searchString = ""
195        self.selectionChangedFlag = False
196        self.useAltSource = 0
197        self.loadSettings()
198       
199        self.infoLabel = OWGUI.widgetLabel(OWGUI.widgetBox(self.controlArea,
200                                                    "Info", addSpace=True),
201                                           "No data on input\n")
202        self.organisms = sorted(set([name.split(".")[-2] for name in \
203                            orngServerFiles.listfiles("NCBI_geneinfo")] + \
204                            obiGene.NCBIGeneInfo.essential_taxids()))
205   
206        self.organismBox = OWGUI.widgetBox(self.controlArea, "Organism",
207                                           addSpace=True)
208        self.organismComboBox = OWGUI.comboBox(self.organismBox, self,
209                                "organismIndex", "Organism",
210                                items=[obiTaxonomy.name(id) for id in self.organisms],
211                                callback=self.setItems,
212                                debuggingEnabled=0)
213       
214        # For now only support one alt source, with a checkbox
215        # In the future this can be extended to multiple selections
216        self.altSourceCheck = OWGUI.checkBox(self.organismBox, self,
217                            "useAltSource", "Show information from dictyBase",
218                            callback=self.onAltSourceChange,
219#                            debuggingEnabled=0,
220                            )
221        self.altSourceCheck.hide()
222       
223        box = OWGUI.widgetBox(self.controlArea, "Gene names", addSpace=True)
224        self.geneAttrComboBox = OWGUI.comboBox(box, self, "geneAttr",
225                                "Gene atttibute", callback=self.setItems)
226       
227        c = OWGUI.checkBox(box, self, "useAttr", "Use attribute names",
228                           callback=self.setItems,
229                           disables=[(-1, self.geneAttrComboBox)])
230       
231        self.geneAttrComboBox.setDisabled(bool(self.useAttr))
232
233        box = OWGUI.widgetBox(self.controlArea, "Commit", addSpace=True)
234        b = OWGUI.button(box, self, "Commit", callback=self.commit)
235        c = OWGUI.checkBox(box, self, "autoCommit", "Commit on change")
236        OWGUI.setStopper(self, b, c, "selectionChangedFlag",
237                         callback=self.commit)
238       
239        ## A label for dictyExpress link
240        self.dictyExpressBox = OWGUI.widgetBox(self.controlArea, "Dicty Express")
241        self.linkLabel = OWGUI.widgetLabel(self.dictyExpressBox, "")
242        self.linkLabel.setOpenExternalLinks(False)
243        self.connect(self.linkLabel, SIGNAL("linkActivated(QString)"),
244                     self.onDictyExpressLink)
245        self.dictyExpressBox.hide()
246       
247        OWGUI.rubber(self.controlArea)
248
249        OWGUI.lineEdit(self.mainArea, self, "searchString", "Filter",
250                       callbackOnType=True, callback=self.searchUpdate)
251       
252        self.treeWidget = QTreeView(self.mainArea)
253        self.treeWidget.setRootIsDecorated(False)
254        self.treeWidget.setSelectionMode(QAbstractItemView.ExtendedSelection)
255        self.treeWidget.setItemDelegate(LinkStyledItemDelegate(self.treeWidget))
256        #self.connect(self.treeWidget, SIGNAL("itemSelectionChanged()"), self.commitIf)
257        self.treeWidget.viewport().setMouseTracking(True)
258        self.treeWidget.setSortingEnabled(True)
259        self.mainArea.layout().addWidget(self.treeWidget)
260       
261        box = OWGUI.widgetBox(self.mainArea, "",
262                              orientation="horizontal")
263        OWGUI.button(box, self, "Select Filtered",
264                     callback=self.selectFiltered)
265        OWGUI.button(box, self, "Clear Selection",
266                     callback=self.treeWidget.clearSelection)
267       
268        self.resize(1000, 700)       
269
270        self.geneinfo = []
271        self.cells = []
272        self.row2geneinfo = {}
273        self.data = None
274        self.currentLoaded = None, None
275        self.selectionUpdateInProgress = False
276       
277    def setData(self, data=None):
278        self.closeContext()
279        self.data = data
280        if data:
281            self.geneAttrComboBox.clear()
282            self.attributes = [attr for attr in self.data.domain.variables + \
283                               self.data.domain.getmetas().values() \
284                               if attr.varType in [orange.VarTypes.String,
285                                                   orange.VarTypes.Discrete]]
286            self.geneAttrComboBox.addItems([attr.name for attr in self.attributes])
287            self.openContext("", data)
288            self.geneAttr = min(self.geneAttr, len(self.attributes) - 1)
289           
290            taxid = data_hints.get_hint(self.data, "taxid", "")
291            if taxid in self.organisms:
292                self.organismIndex = self.organisms.index(taxid)
293               
294            self.useAttr = data_hints.get_hint(self.data, "genesinrows",  self.useAttr)
295           
296            self.setItems()
297        else:
298            self.clear()
299
300    def infoSource(self):
301        """ Return the current selected info source getter function from
302        INFO_SOURCES
303        """
304        org = self.organisms[min(self.organismIndex, len(self.organisms) - 1)]
305        if org not in INFO_SOURCES:
306            org = "default"
307        sources = INFO_SOURCES[org]
308        name, func =  sources[min(self.useAltSource, len(sources) - 1)]
309        return name, func
310       
311    def setItems(self):
312        self.warning(0)
313        if not self.data:
314            return
315        if self.useAttr:
316            genes = [attr.name for attr in self.data.domain.attributes]
317        elif self.attributes:
318            attr = self.attributes[self.geneAttr]
319            genes = [str(ex[attr]) for ex in self.data if not ex[attr].isSpecial()]
320        else:
321            genes = []
322        if not genes:
323            self.warning(0, "Could not extract genes from input dataset.")
324        self.warning(1)
325        org = self.organisms[min(self.organismIndex, len(self.organisms) - 1)]
326        source_name, info_getter = self.infoSource()
327        info , currorg = self.currentLoaded
328        self.error(0)
329       
330        self.updateDictyExpressLink(genes, show=org == "352472")
331        self.altSourceCheck.setVisible(org == "352472")
332       
333        # get the info for the genes in a separate thread
334        self.progressBarInit()
335#        call = self.asyncCall(info_getter, (org, genes),
336#                              name="Load NCBI Gene Info",
337#                              blocking=False)
338#        call.connect(call, SIGNAL("progressChanged(float)"), self.progressBarSet, Qt.QueuedConnection)
339#        with orngServerFiles.DownloadProgress.setredirect(call.emitProgressChanged):
340#            call.__call__()
341#            schema, geneinfo = call.get_result()
342#        call.__call__()
343#        schema, geneinfo = call.get_result()
344        with orngServerFiles.DownloadProgress.setredirect(self.progressBarSet):
345            schema, geneinfo = info_getter(org, genes)
346        self.progressBarFinished()
347        # schema, geneinfo = info_getter(org, genes)
348
349        self.geneinfo = geneinfo = list(zip(genes, geneinfo))
350
351        self.progressBarInit()
352        milestones = set([i for i in range(0, len(geneinfo), max(len(geneinfo)/100, 1))])
353        self.cells = cells = []
354        self.row2geneinfo = {}
355        links = []
356        for i, (gene, gi) in enumerate(geneinfo):
357            if gi:
358                row = []
359                for sch, item in zip(schema, gi):
360                    if isinstance(item, Link): # TODO: This should be handled by delegates
361                        row.append(item.text)
362                        links.append(item.link)
363                    else:
364                        row.append(item)
365                cells.append(row)
366                self.row2geneinfo[len(cells) - 1] = i
367#                cells.append([gi.gene_id, gi.symbol + " (%s)" % gene if gene != gi.symbol else gi.symbol,
368#                            gi.locus_tag or "", gi.chromosome or "", gi.description or "",
369#                            ", ".join(gi.synonyms), gi.symbol_from_nomenclature_authority or ""])
370#                links.append("http://www.ncbi.nlm.nih.gov/sites/entrez?Db=gene&Cmd=ShowDetailView&TermToSearch=%s" % gi.gene_id)
371               
372
373            if i in milestones:
374                self.progressBarSet(100.0*i/len(geneinfo))
375        model = TreeModel(cells, [str(col) for col in schema], self.treeWidget)
376       
377        model.setColumnLinks(0, links)
378        proxyModel = QSortFilterProxyModel(self)
379        proxyModel.setSourceModel(model)
380        self.treeWidget.setModel(proxyModel)
381        self.connect(self.treeWidget.selectionModel(), SIGNAL("selectionChanged(QItemSelection , QItemSelection )"), self.commitIf)
382        for i in range(7):
383            self.treeWidget.resizeColumnToContents(i)
384            self.treeWidget.setColumnWidth(i, min(self.treeWidget.columnWidth(i), 200))
385        self.treeWidget.update()
386        self.progressBarFinished()
387
388        self.infoLabel.setText("%i genes\n%i matched NCBI's IDs" % (len(genes), len(cells)))
389        self.matchedInfo = len(genes), len(cells)
390
391    def clear(self):
392        self.infoLabel.setText("No data on input\n")
393        self.treeWidget.setModel(TreeModel([], ["NCBI ID", "Symbol", "Locus Tag",
394                                            "Chromosome", "Description", "Synonyms",
395                                            "Nomenclature"], self.treeWidget))
396        self.geneAttrComboBox.clear()
397        self.send("Selected Examples", None)
398
399    def commitIf(self, *args):
400        if self.autoCommit and not self.selectionUpdateInProgress:
401            self.commit()
402        else:
403            self.selectionChangedFlag = True
404
405    def commit(self):
406        if not self.data:
407            return
408        model = self.treeWidget.model()
409        mapToSource = model.mapToSource
410        selectedIds = [self.cells[mapToSource(index).row()][0] for index in self.treeWidget.selectedIndexes()]
411        selectedRows = self.treeWidget.selectedIndexes()
412        selectedRows = [mapToSource(index).row() for index in selectedRows]
413        model = model.sourceModel()
414       
415        selectedGeneids = [self.row2geneinfo[row] for row in selectedRows]
416        selectedIds = [self.geneinfo[i][0] for i in selectedGeneids]
417        selectedIds = set(selectedIds)
418        gene2row = dict((self.geneinfo[self.row2geneinfo[row]][0], row) \
419                        for row in selectedRows)
420       
421        if self.useAttr:
422            def is_selected(attr):
423                return attr.name in selectedIds
424            attrs = [attr for attr in self.data.domain.attributes if is_selected(attr)]
425            domain = orange.Domain(attrs, self.data.domain.classVar)
426            domain.addmetas(self.data.domain.getmetas())
427            newdata = orange.ExampleTable(domain, self.data)
428            self.send("Selected Examples", newdata)
429        elif self.attributes:
430            attr = self.attributes[self.geneAttr]
431            geneinfo = dict(self.geneinfo)
432            examples = [ex for ex in self.data if str(ex[attr]) in selectedIds]
433            if True:  # Add gene info
434                domain = orange.Domain(self.data.domain, self.data.domain.classVar)
435                domain.addmetas(self.data.domain.getmetas())
436                n_columns = model.columnCount()
437
438                headers = [str(model.headerData(i, Qt.Horizontal, Qt.DisplayRole).toString()) \
439                           for i in range(n_columns)]
440                new_meta_attrs = [(orange.newmetaid(), orange.StringVariable(name)) \
441                                  for name in headers]
442                domain.addmetas(dict(new_meta_attrs))
443                examples = [orange.Example(domain, ex) for ex in examples]
444                for ex in examples:
445                    for i, (_, meta) in enumerate(new_meta_attrs):
446                        row = gene2row[str(ex[attr])]
447                        ex[meta] = str(model.data(model.index(row, i), Qt.DisplayRole).toString())
448
449            if examples:
450                newdata = orange.ExampleTable(examples)
451            else:
452                newdata = None
453            self.send("Selected Examples", newdata)
454        else:
455            self.send("Selected Examples", None)
456           
457    def rowFiltered(self, row):
458        searchStrings = self.searchString.lower().split()
459        row = unicode(" ".join(self.cells[row]).lower(), errors="ignore")
460        return not all([s in row for s in searchStrings])
461   
462    def searchUpdate(self):
463        if not self.data:
464            return
465        searchStrings = self.searchString.lower().split()
466        index = self.treeWidget.model().sourceModel().index
467        mapFromSource = self.treeWidget.model().mapFromSource
468        for i, row in enumerate(self.cells):
469            row = unicode(" ".join(row).lower(), errors="ignore")
470            self.treeWidget.setRowHidden(mapFromSource(index(i, 0)).row(), QModelIndex(), not all([s in row for s in searchStrings]))
471        #self.treeWidget.model().setFilterRegExp(QRegExp(self.searchString, Qt.CaseInsensitive, QRegExp.FixedString))
472           
473    def selectFiltered(self):
474        if not self.data:
475            return
476        itemSelection = QItemSelection()
477       
478        index = self.treeWidget.model().sourceModel().index
479        mapFromSource = self.treeWidget.model().mapFromSource
480        for i, row in enumerate(self.cells):
481            if not self.rowFiltered(i):
482                itemSelection.select(mapFromSource(index(i, 0)), mapFromSource(index(i, 0)))
483        self.treeWidget.selectionModel().select(itemSelection, QItemSelectionModel.Select | QItemSelectionModel.Rows)
484       
485    def sendReport(self):
486        from Orange.OrangeWidgets import OWReport
487        genes, matched = self.matchedInfo
488        info, org = self.currentLoaded
489        self.reportRaw("<p>Input: %i genes of which %i (%.1f%%) matched NCBI synonyms<br>Organism: %s<br>Filter: %s</p>" % (genes, matched, 100.0 * matched / genes, obiTaxonomy.name(org), self.searchString))
490        self.reportSubsection("Gene list")
491        self.reportRaw(reportItemView(self.treeWidget))
492       
493    def updateDictyExpressLink(self, genes, show=False):
494        def fix(ddb):
495            if ddb.startswith("DDB"): 
496                if not ddb.startswith("DDB_G"):
497                    ddb = ddb.replace("DDB", "DDB_G")
498                return ddb
499            return None 
500        if show:
501            genes = [fix(gene) for gene in genes if fix(gene)]
502            link1 = '<a href="http://dictyexpress.biolab.si/run/index.php?gene=%s">Microarray profile</a>'
503            link2 = '<a href="http://dictyexpress.biolab.si/run/index.php?gene=%s&db=rnaseq">RNA-Seq profile</a>'
504            self.linkLabel.setText(link1 + "<br/>" + link2)
505           
506            show = any(genes)
507               
508        if show:
509            self.dictyExpressBox.show()
510        else:
511            self.dictyExpressBox.hide()
512
513    def onDictyExpressLink(self, link):
514        if not self.data:
515            return
516
517        selectedIndexes = self.treeWidget.selectedIndexes()
518        if not len(selectedIndexes):
519            QMessageBox.information(self, "No gene ids selected", "Please select some genes and try again.")
520            return
521        model = self.treeWidget.model()
522        mapToSource = model.mapToSource
523        selectedIds = [self.cells[mapToSource(index).row()][0] for index in selectedIndexes]
524        selectedRows = self.treeWidget.selectedIndexes()
525        selectedRows = [mapToSource(index).row() for index in selectedRows]
526        model = model.sourceModel()
527
528        selectedGeneids = [self.row2geneinfo[row] for row in selectedRows]
529        selectedIds = [self.geneinfo[i][0] for i in selectedGeneids]
530        selectedIds = set(selectedIds)
531
532        def fix(ddb):
533            if ddb.startswith("DDB"):
534                if not ddb.startswith("DDB_G"):
535                    ddb = ddb.replace("DDB", "DDB_G")
536                return ddb
537            return None
538
539        genes = [fix(gene) for gene in selectedIds if fix(gene)]
540        url = str(link) % " ".join(genes)
541        QDesktopServices.openUrl(QUrl(url))
542           
543    def onAltSourceChange(self):
544        self.setItems()
545       
546def reportItemView(view):
547    model = view.model()
548    return reportItemModel(view, model)
549   
550def reportItemModel(view, model, index=QModelIndex()):
551    if not index.isValid() or model.hasChildren(index):
552        columnCount, rowCount = model.columnCount(index), model.rowCount(index)
553        if not index.isValid():
554            text = '<table>\n<tr>' + ''.join('<th>%s</th>' % model.headerData(i, Qt.Horizontal, Qt.DisplayRole).toString() for i in range(columnCount)) +'</tr>\n'
555        else:
556#            variant = model.data(index, Qt.DisplayRole)
557#            text = '<table' + (' caption="%s"' % variant.toString() if variant.isValid() else '') + '>\n'
558            pass
559        text += ''.join('<tr>' + ''.join('<td>' + reportItemModel(view, model, model.index(row, column, index)) + '</td>' for column in range(columnCount)) + '</tr>\n' for row in range(rowCount) if not view.isRowHidden(row, index))
560        text += '</table>'
561        return text
562    else:
563        variant = model.data(index, Qt.DisplayRole)
564        return str(variant.toString()) if variant.isValid() else ""
565       
566if __name__ == "__main__":
567    app = QApplication(sys.argv)
568    data = orange.ExampleTable("brown-selected.tab")
569    w = OWGeneInfo()
570    w.show()
571    w.setData(data)
572    app.exec_()
573    w.saveSettings()
574       
575       
576       
577       
Note: See TracBrowser for help on using the repository browser.