source: orange-bioinformatics/Orange/bioinformatics/widgets/OWGeneInfo.py @ 1632:9cf919d0f343

Revision 1632:9cf919d0f343, 21.3 KB checked in by mitar, 2 years ago (diff)

Fixing imports.

Line 
1"""
2<name>Gene Info</name>
3<description>Displays gene information from NCBI and other sources.</description>
4<priority>2010</priority>
5<contact>Ales Erjavec (ales.erjavec(@at@)fri.uni-lj.si)</contact>
6<icon>icons/GeneInfo.png</icon>
7"""
8
9from __future__ import absolute_import, with_statement
10
11from collections import defaultdict
12from functools import partial
13
14import orange
15from Orange.orng import orngServerFiles
16from Orange.orng.orngDataCaching import data_hints
17from Orange.OrangeWidgets import OWGUI
18from Orange.OrangeWidgets.OWWidget import *
19
20from .. import obiGene, obiTaxonomy
21
22class TreeModel(QAbstractItemModel):
23    def __init__(self, data, header, parent):
24        QAbstractItemModel.__init__(self, parent)
25        self._data = [[QVariant(s) for s in row] for row in data]
26        self._dataDict = {}
27        self._header = header
28        self._roleData = {Qt.DisplayRole:self._data}
29        self._roleData = partial(defaultdict, partial(defaultdict, partial(defaultdict, QVariant)))(self._roleData)
30   
31    def setColumnLinks(self, column, links):
32        font =QFont()
33        font.setUnderline(True)
34        font = QVariant(font)
35        for i, link in enumerate(links):
36            self._roleData[LinkRole][i][column] = QVariant(link)
37            self._roleData[Qt.FontRole][i][column] = font
38            self._roleData[Qt.ForegroundRole][i][column] = QVariant(QColor(Qt.blue))
39   
40    def setRoleData(self, role, row, col, data):
41        self._roleData[role][row][col] = data
42       
43    def data(self, index, role):
44        row, col = index.row(), index.column()
45        return self._roleData[role][row][col]
46       
47    def index(self, row, col, parent=QModelIndex()):
48        return self.createIndex(row, col, 0)
49   
50    def parent(self, index):
51        return QModelIndex()
52   
53    def rowCount(self, index):
54        if index.isValid():
55            return 0
56        else:
57            return len(self._data)
58       
59    def columnCount(self, index):
60        return len(self._header)
61
62    def headerData(self, section, orientation, role):
63        if role==Qt.DisplayRole:
64            return QVariant(self._header[section])
65        return QVariant()
66
67from Orange.OrangeWidgets.OWGUI import LinkStyledItemDelegate, LinkRole
68
69def lru_cache(maxsize=100):
70    """ A least recently used cache function decorator.
71    """
72   
73    def decorating_function(func):
74        import functools
75        cache = {}
76       
77        functools.wraps(func)
78        def wrapped(*args, **kwargs):
79            key = args + tuple(sorted(kwargs.items()))
80            if key not in cache:
81                res = func(*args, **kwargs)
82                cache[key] = (time.time(), res)
83                if len(cache) > maxsize:
84                    key, (_, _) = min(cache.iteritems(), key=lambda item: item[1][0])
85                    del cache[key]
86            else:
87                _, res = cache[key]
88                cache[key] = (time.time(), res) # update the time
89               
90            return res
91       
92        def clear():
93            cache.clear()
94       
95        wrapped.clear = clear
96       
97        return wrapped
98    return decorating_function
99               
100class LinkFmt(object):
101    def __init__(self, link_fmt, name):
102        self.link_fmt = link_fmt
103        self.name = name
104       
105    def format(self, *args, **kwargs):
106        return Link(self.link_fmt.format(*args, **kwargs), **kwargs)
107   
108    def __repr__(self):
109        return "<LinkFmt " + repr(self.name) + " >"
110   
111    def __str__(self):
112        return self.name
113   
114class Link(object):
115    def __init__(self, link, text=None, **kwargs):
116        self.link = link
117        self.text = text if text is not None else "link"
118        self.__dict__.update(kwargs)
119       
120    def str(self):
121        return link
122   
123   
124@lru_cache(maxsize=2)
125def get_ncbi_info(taxid):
126    return obiGene.NCBIGeneInfo(taxid)
127
128def ncbi_info(taxid, genes):
129    info = get_ncbi_info(taxid)
130    schema_link = LinkFmt("http://www.ncbi.nlm.nih.gov/sites/entrez?Db=gene&Cmd=ShowDetailView&TermToSearch={gene_id}", name="NCBI ID")
131    schema = [schema_link, "Symbol", "Locus Tag", "Chromosome",
132              "Description", "Synonyms", "Nomenclature"]
133    ret = []
134    for gene in genes:
135        gi = info.get_info(gene)
136        if gi:
137            ret.append([schema_link.format(gene_id=gi.gene_id, text=gi.gene_id),
138                        gi.symbol + " (%s)" % gene if gene != gi.symbol else gi.symbol,
139                        gi.locus_tag or "",
140                        gi.chromosome or "",
141                        gi.description or "",
142                        ", ".join(gi.synonyms),
143                        gi.symbol_from_nomenclature_authority or ""
144                        ])
145        else:
146            ret.append(None)
147    return schema, ret
148   
149def dicty_info(taxid, genes):
150    from .. import obiDicty
151    info = obiDicty.DictyBase()
152    name_matcher = obiGene.GMDicty()
153    name_matcher.set_targets(info.info.keys())
154    schema_link = LinkFmt("http://dictybase.org/db/cgi-bin/gene_page.pl?dictybaseid={gene_id}", name="Dicty Base Id")
155    schema = [schema_link, "Name", "Synonyms", "Gene Products"]
156   
157    ret = []
158    for gene in genes:
159        gene = name_matcher.umatch(gene)
160        gi = info.info.get(gene, None)
161        if gi:
162            ret.append([schema_link.format(gene_id=gene, text=gene),
163                        gi[0] + " (%s)" % gene if gene != gi[0] else gi[0], # Gene Name
164                        ", ".join(gi[1]), # Synonyms
165                        gi[2] or "", # Gene Products
166                        ])
167           
168        else:
169            ret.append(None)
170   
171    return schema, ret
172   
173   
174INFO_SOURCES = {"default": [("NCBI Info", ncbi_info)],
175                "352472": [("NCBI Info", ncbi_info),
176                           ("Dicty Base", dicty_info)
177                           ]
178                }
179
180class OWGeneInfo(OWWidget):
181    settingsList = ["organismIndex", "geneAttr", "useAttr", "autoCommit"]
182    contextHandlers = {"":DomainContextHandler("", ["organismIndex",
183                                "geneAttr", "useAttr", "useAltSource"])}
184    def __init__(self, parent=None, signalManager=None, name="Gene Info"):
185        OWWidget.__init__(self, parent, signalManager, name)
186
187        self.inputs = [("Examples", ExampleTable, self.setData)]
188        self.outputs = [("Selected Examples", ExampleTable)]
189
190        self.organismIndex = 0
191        self.geneAttr = 0
192        self.useAttr = False
193        self.autoCommit = False
194        self.searchString = ""
195        self.selectionChangedFlag = False
196        self.useAltSource = 0
197        self.loadSettings()
198       
199        self.infoLabel = OWGUI.widgetLabel(OWGUI.widgetBox(self.controlArea,
200                                                    "Info", addSpace=True),
201                                           "No data on input\n")
202        self.organisms = sorted(set([name.split(".")[-2] for name in \
203                            orngServerFiles.listfiles("NCBI_geneinfo")] + \
204                            obiGene.NCBIGeneInfo.essential_taxids()))
205   
206        self.organismBox = OWGUI.widgetBox(self.controlArea, "Organism",
207                                           addSpace=True)
208        self.organismComboBox = OWGUI.comboBox(self.organismBox, self,
209                                "organismIndex", "Organism",
210                                items=[obiTaxonomy.name(id) for id in self.organisms],
211                                callback=self.setItems,
212                                debuggingEnabled=0)
213       
214        # For now only support one alt source, with a checkbox
215        # In the future this can be extended to multiple selections
216        self.altSourceCheck = OWGUI.checkBox(self.organismBox, self,
217                            "useAltSource", "Show information from dictyBase",
218                            callback=self.onAltSourceChange,
219#                            debuggingEnabled=0,
220                            )
221        self.altSourceCheck.hide()
222       
223        box = OWGUI.widgetBox(self.controlArea, "Gene names", addSpace=True)
224        self.geneAttrComboBox = OWGUI.comboBox(box, self, "geneAttr",
225                                "Gene atttibute", callback=self.setItems)
226       
227        c = OWGUI.checkBox(box, self, "useAttr", "Use attribute names",
228                           callback=self.setItems,
229                           disables=[(-1, self.geneAttrComboBox)])
230       
231        self.geneAttrComboBox.setDisabled(bool(self.useAttr))
232
233        box = OWGUI.widgetBox(self.controlArea, "Commit", addSpace=True)
234        b = OWGUI.button(box, self, "Commit", callback=self.commit)
235        c = OWGUI.checkBox(box, self, "autoCommit", "Commit on change")
236        OWGUI.setStopper(self, b, c, "selectionChangedFlag",
237                         callback=self.commit)
238       
239        ## A label for dictyExpress link
240        self.dictyExpressBox = OWGUI.widgetBox(self.controlArea, "Dicty Express")
241        self.linkLabel = OWGUI.widgetLabel(self.dictyExpressBox, "")
242        self.linkLabel.setOpenExternalLinks(True)
243        self.dictyExpressBox.hide()
244       
245        OWGUI.rubber(self.controlArea)
246
247        OWGUI.lineEdit(self.mainArea, self, "searchString", "Filter",
248                       callbackOnType=True, callback=self.searchUpdate)
249       
250        self.treeWidget = QTreeView(self.mainArea)
251        self.treeWidget.setRootIsDecorated(False)
252        self.treeWidget.setSelectionMode(QAbstractItemView.ExtendedSelection)
253        self.treeWidget.setItemDelegate(LinkStyledItemDelegate(self.treeWidget))
254        #self.connect(self.treeWidget, SIGNAL("itemSelectionChanged()"), self.commitIf)
255        self.treeWidget.viewport().setMouseTracking(True)
256        self.treeWidget.setSortingEnabled(True)
257        self.mainArea.layout().addWidget(self.treeWidget)
258       
259        box = OWGUI.widgetBox(self.mainArea, "",
260                              orientation="horizontal")
261        OWGUI.button(box, self, "Select Filtered",
262                     callback=self.selectFiltered)
263        OWGUI.button(box, self, "Clear Selection",
264                     callback=self.treeWidget.clearSelection)
265       
266        self.resize(1000, 700)       
267
268        self.geneinfo = []
269        self.cells = []
270        self.row2geneinfo = {}
271        self.data = None
272        self.currentLoaded = None, None
273        self.selectionUpdateInProgress = False
274       
275    def setData(self, data=None):
276        self.closeContext()
277        self.data = data
278        if data:
279            self.geneAttrComboBox.clear()
280            self.attributes = [attr for attr in self.data.domain.variables + \
281                               self.data.domain.getmetas().values() \
282                               if attr.varType in [orange.VarTypes.String,
283                                                   orange.VarTypes.Discrete]]
284            self.geneAttrComboBox.addItems([attr.name for attr in self.attributes])
285            self.openContext("", data)
286            self.geneAttr = min(self.geneAttr, len(self.attributes) - 1)
287           
288            taxid = data_hints.get_hint(self.data, "taxid", "")
289            if taxid in self.organisms:
290                self.organismIndex = self.organisms.index(taxid)
291               
292            self.useAttr = data_hints.get_hint(self.data, "genesinrows",  self.useAttr)
293           
294            self.setItems()
295        else:
296            self.clear()
297
298    def infoSource(self):
299        """ Return the current selected info source getter function from
300        INFO_SOURCES
301        """
302        org = self.organisms[min(self.organismIndex, len(self.organisms) - 1)]
303        if org not in INFO_SOURCES:
304            org = "default"
305        sources = INFO_SOURCES[org]
306        name, func =  sources[min(self.useAltSource, len(sources) - 1)]
307        return name, func
308       
309    def setItems(self):
310        self.warning(0)
311        if not self.data:
312            return
313        if self.useAttr:
314            genes = [attr.name for attr in self.data.domain.attributes]
315        elif self.attributes:
316            attr = self.attributes[self.geneAttr]
317            genes = [str(ex[attr]) for ex in self.data if not ex[attr].isSpecial()]
318        else:
319            genes = []
320        if not genes:
321            self.warning(0, "Could not extract genes from input dataset.")
322        self.warning(1)
323        org = self.organisms[min(self.organismIndex, len(self.organisms) - 1)]
324        source_name, info_getter = self.infoSource()
325        info , currorg = self.currentLoaded
326        self.error(0)
327       
328        self.updateDictyExpressLink(genes, show=org == "352472")
329        self.altSourceCheck.setVisible(org == "352472")
330       
331        # get the info for the genes in a separate thread
332        self.progressBarInit()
333#        call = self.asyncCall(info_getter, (org, genes),
334#                              name="Load NCBI Gene Info",
335#                              blocking=False)
336#        call.connect(call, SIGNAL("progressChanged(float)"), self.progressBarSet, Qt.QueuedConnection)
337#        with orngServerFiles.DownloadProgress.setredirect(call.emitProgressChanged):
338#            call.__call__()
339#            schema, geneinfo = call.get_result()
340#        call.__call__()
341#        schema, geneinfo = call.get_result()
342        with orngServerFiles.DownloadProgress.setredirect(self.progressBarSet):
343            schema, geneinfo = info_getter(org, genes)
344        self.progressBarFinished()
345        # schema, geneinfo = info_getter(org, genes)
346
347        self.geneinfo = geneinfo = list(zip(genes, geneinfo))
348
349        self.progressBarInit()
350        milestones = set([i for i in range(0, len(geneinfo), max(len(geneinfo)/100, 1))])
351        self.cells = cells = []
352        self.row2geneinfo = {}
353        links = []
354        for i, (gene, gi) in enumerate(geneinfo):
355            if gi:
356                row = []
357                for sch, item in zip(schema, gi):
358                    if isinstance(item, Link): # TODO: This should be handled by delegates
359                        row.append(item.text)
360                        links.append(item.link)
361                    else:
362                        row.append(item)
363                cells.append(row)
364                self.row2geneinfo[len(cells) - 1] = i
365#                cells.append([gi.gene_id, gi.symbol + " (%s)" % gene if gene != gi.symbol else gi.symbol,
366#                            gi.locus_tag or "", gi.chromosome or "", gi.description or "",
367#                            ", ".join(gi.synonyms), gi.symbol_from_nomenclature_authority or ""])
368#                links.append("http://www.ncbi.nlm.nih.gov/sites/entrez?Db=gene&Cmd=ShowDetailView&TermToSearch=%s" % gi.gene_id)
369               
370
371            if i in milestones:
372                self.progressBarSet(100.0*i/len(geneinfo))
373        model = TreeModel(cells, [str(col) for col in schema], self.treeWidget)
374       
375        model.setColumnLinks(0, links)
376        proxyModel = QSortFilterProxyModel(self)
377        proxyModel.setSourceModel(model)
378        self.treeWidget.setModel(proxyModel)
379        self.connect(self.treeWidget.selectionModel(), SIGNAL("selectionChanged(QItemSelection , QItemSelection )"), self.commitIf)
380        for i in range(7):
381            self.treeWidget.resizeColumnToContents(i)
382            self.treeWidget.setColumnWidth(i, min(self.treeWidget.columnWidth(i), 200))
383        self.treeWidget.update()
384        self.progressBarFinished()
385
386        self.infoLabel.setText("%i genes\n%i matched NCBI's IDs" % (len(genes), len(cells)))
387        self.matchedInfo = len(genes), len(cells)
388
389    def clear(self):
390        self.infoLabel.setText("No data on input\n")
391        self.treeWidget.setModel(TreeModel([], ["NCBI ID", "Symbol", "Locus Tag",
392                                            "Chromosome", "Description", "Synonyms",
393                                            "Nomenclature"], self.treeWidget))
394        self.geneAttrComboBox.clear()
395        self.send("Selected Examples", None)
396
397    def commitIf(self, *args):
398        if self.autoCommit and not self.selectionUpdateInProgress:
399            self.commit()
400        else:
401            self.selectionChangedFlag = True
402
403    def commit(self):
404        if not self.data:
405            return
406       
407        mapToSource = self.treeWidget.model().mapToSource
408        selectedIds = [self.cells[mapToSource(index).row()][0] for index in self.treeWidget.selectedIndexes()]
409        selectedRows = self.treeWidget.selectedIndexes()
410        selectedRows = [mapToSource(index).row() for index in selectedRows]
411       
412        selectedGeneids = [self.row2geneinfo[row] for row in selectedRows]
413        selectedIds = [self.geneinfo[i][0] for i in selectedGeneids]
414        selectedIds = set(selectedIds)
415       
416        if self.useAttr:
417            def is_selected(attr):
418                return attr.name in selectedIds
419            attrs = [attr for attr in self.data.domain.attributes if is_selected(attr)]
420            domain = orange.Domain(attrs, self.data.domain.classVar)
421            domain.addmetas(self.data.domain.getmetas())
422            newdata = orange.ExampleTable(domain, self.data)
423            self.send("Selected Examples", newdata)
424        elif self.attributes:
425            attr = self.attributes[self.geneAttr]
426            geneinfo = dict(self.geneinfo)
427            examples = [ex for ex in self.data if str(ex[attr]) in selectedIds]
428            if examples:
429                newdata = orange.ExampleTable(examples)
430            else:
431                newdata = None
432            self.send("Selected Examples", newdata)
433        else:
434            self.send("Selected Examples", None)
435           
436    def rowFiltered(self, row):
437        searchStrings = self.searchString.lower().split()
438        row = unicode(" ".join(self.cells[row]).lower(), errors="ignore")
439        return not all([s in row for s in searchStrings])
440   
441    def searchUpdate(self):
442        if not self.data:
443            return
444        searchStrings = self.searchString.lower().split()
445        index = self.treeWidget.model().sourceModel().index
446        mapFromSource = self.treeWidget.model().mapFromSource
447        for i, row in enumerate(self.cells):
448            row = unicode(" ".join(row).lower(), errors="ignore")
449            self.treeWidget.setRowHidden(mapFromSource(index(i, 0)).row(), QModelIndex(), not all([s in row for s in searchStrings]))
450        #self.treeWidget.model().setFilterRegExp(QRegExp(self.searchString, Qt.CaseInsensitive, QRegExp.FixedString))
451           
452    def selectFiltered(self):
453        if not self.data:
454            return
455        itemSelection = QItemSelection()
456       
457        index = self.treeWidget.model().sourceModel().index
458        mapFromSource = self.treeWidget.model().mapFromSource
459        for i, row in enumerate(self.cells):
460            if not self.rowFiltered(i):
461                itemSelection.select(mapFromSource(index(i, 0)), mapFromSource(index(i, 0)))
462        self.treeWidget.selectionModel().select(itemSelection, QItemSelectionModel.Select | QItemSelectionModel.Rows)
463       
464    def sendReport(self):
465        from Orange.OrangeWidgets import OWReport
466        genes, matched = self.matchedInfo
467        info, org = self.currentLoaded
468        self.reportRaw("<p>Input: %i genes of which %i (%.1f%%) matched NCBI synonyms<br>Organism: %s<br>Filter: %s</p>" % (genes, matched, 100.0 * matched / genes, obiTaxonomy.name(org), self.searchString))
469        self.reportSubsection("Gene list")
470        self.reportRaw(reportItemView(self.treeWidget))
471       
472    def updateDictyExpressLink(self, genes, show=False):
473        def fix(ddb):
474            if ddb.startswith("DDB"): 
475                if not ddb.startswith("DDB_G"):
476                    ddb = ddb.replace("DDB", "DDB_G")
477                return ddb
478            return None 
479        if show:
480            genes = [fix(gene) for gene in genes if fix(gene)]
481            link1 = '<a href="http://www.ailab.si/dictyexpress/run/index.php?gene=%s">Microarray profile</a>' % (" ".join(genes))
482            link2 = '<a href="http://www.ailab.si/dictyexpress/run/index.php?gene=%s&db=rnaseq">RNA-Seq profile</a>' % (" ".join(genes))
483            self.linkLabel.setText(link1 + "<br/>" + link2)
484           
485            show = any(genes)
486               
487        if show:
488            self.dictyExpressBox.show()
489        else:
490            self.dictyExpressBox.hide()
491           
492    def onAltSourceChange(self):
493        self.setItems()
494       
495def reportItemView(view):
496    model = view.model()
497    return reportItemModel(view, model)
498   
499def reportItemModel(view, model, index=QModelIndex()):
500    if not index.isValid() or model.hasChildren(index):
501        columnCount, rowCount = model.columnCount(index), model.rowCount(index)
502        if not index.isValid():
503            text = '<table>\n<tr>' + ''.join('<th>%s</th>' % model.headerData(i, Qt.Horizontal, Qt.DisplayRole).toString() for i in range(columnCount)) +'</tr>\n'
504        else:
505#            variant = model.data(index, Qt.DisplayRole)
506#            text = '<table' + (' caption="%s"' % variant.toString() if variant.isValid() else '') + '>\n'
507            pass
508        text += ''.join('<tr>' + ''.join('<td>' + reportItemModel(view, model, model.index(row, column, index)) + '</td>' for column in range(columnCount)) + '</tr>\n' for row in range(rowCount) if not view.isRowHidden(row, index))
509        text += '</table>'
510        return text
511    else:
512        variant = model.data(index, Qt.DisplayRole)
513        return str(variant.toString()) if variant.isValid() else ""
514       
515if __name__ == "__main__":
516    app = QApplication(sys.argv)
517    data = orange.ExampleTable("../../orange/doc/datasets/brown-selected.tab")
518    w = OWGeneInfo()
519    w.show()
520    w.setData(data)
521    app.exec_()
522    w.saveSettings()
523       
524       
525       
526       
Note: See TracBrowser for help on using the repository browser.