source: orange/orange/doc/datasets/horse-colic_test.htm @ 1760:9d4bb141fb0e

Revision 1760:9d4bb141fb0e, 9.0 KB checked in by blaz <blaz.zupan@…>, 9 years ago (diff)

data info file

Line 
1<html>
2<head>
3<title>Credit Approval Data Base</title>
4</head>
5<body>
6<h1>Info on Credit Approval Data Base</h1>
7<pre>
81. Title: Horse Colic database
9
102. Source Information
11   -- Creators: Mary McLeish & Matt Cecile
12        Department of Computer Science
13        University of Guelph
14        Guelph, Ontario, Canada N1G 2W1
15        mdmcleish@water.waterloo.edu
16   -- Donor:    Will Taylor (taylor@pluto.arc.nasa.gov)
17   -- Date:     8/6/89
18
193. Past Usage:
20   -- Unknown
21
224. Relevant Information:
23
24   -- 2 data files
25      -- horse-colic.data: 300 training instances
26      -- horse-colic.test: 68 test instances
27   -- Possible class attributes: 24 (whether lesion is surgical)
28     -- others include: 23, 25, 26, and 27
29   -- Many Data types: (continuous, discrete, and nominal)
30
315. Number of Instances: 368 (300 for training, 68 for testing)
32
336. Number of attributes: 28
34
357. Attribute Information:
36
37  1:  surgery?
38          1 = Yes, it had surgery
39          2 = It was treated without surgery
40
41  2:  Age
42          1 = Adult horse
43          2 = Young (< 6 months)
44
45  3:  Hospital Number 
46          - numeric id
47          - the case number assigned to the horse
48            (may not be unique if the horse is treated > 1 time)
49
50  4:  rectal temperature
51          - linear
52          - in degrees celsius.
53          - An elevated temp may occur due to infection.
54          - temperature may be reduced when the animal is in late shock
55          - normal temp is 37.8
56          - this parameter will usually change as the problem progresses
57               eg. may start out normal, then become elevated because of
58                   the lesion, passing back through the normal range as the
59                   horse goes into shock
60  5:  pulse
61          - linear
62          - the heart rate in beats per minute
63          - is a reflection of the heart condition: 30 -40 is normal for adults
64          - rare to have a lower than normal rate although athletic horses
65            may have a rate of 20-25
66          - animals with painful lesions or suffering from circulatory shock
67            may have an elevated heart rate
68
69  6:  respiratory rate
70          - linear
71          - normal rate is 8 to 10
72          - usefulness is doubtful due to the great fluctuations
73
74  7:  temperature of extremities
75          - a subjective indication of peripheral circulation
76          - possible values:
77               1 = Normal
78               2 = Warm
79               3 = Cool
80               4 = Cold
81          - cool to cold extremities indicate possible shock
82          - hot extremities should correlate with an elevated rectal temp.
83
84  8:  peripheral pulse
85          - subjective
86          - possible values are:
87               1 = normal
88               2 = increased
89               3 = reduced
90               4 = absent
91          - normal or increased p.p. are indicative of adequate circulation
92            while reduced or absent indicate poor perfusion
93
94  9:  mucous membranes
95          - a subjective measurement of colour
96          - possible values are:
97               1 = normal pink
98               2 = bright pink
99               3 = pale pink
100               4 = pale cyanotic
101               5 = bright red / injected
102               6 = dark cyanotic
103          - 1 and 2 probably indicate a normal or slightly increased
104            circulation
105          - 3 may occur in early shock
106          - 4 and 6 are indicative of serious circulatory compromise
107          - 5 is more indicative of a septicemia
108
109 10: capillary refill time
110          - a clinical judgement. The longer the refill, the poorer the
111            circulation
112          - possible values
113               1 = < 3 seconds
114               2 = >= 3 seconds
115
116 11: pain - a subjective judgement of the horse's pain level
117          - possible values:
118               1 = alert, no pain
119               2 = depressed
120               3 = intermittent mild pain
121               4 = intermittent severe pain
122               5 = continuous severe pain
123          - should NOT be treated as a ordered or discrete variable!
124          - In general, the more painful, the more likely it is to require
125            surgery
126          - prior treatment of pain may mask the pain level to some extent
127
128 12: peristalsis                             
129          - an indication of the activity in the horse's gut. As the gut
130            becomes more distended or the horse becomes more toxic, the
131            activity decreases
132          - possible values:
133               1 = hypermotile
134               2 = normal
135               3 = hypomotile
136               4 = absent
137
138 13: abdominal distension
139          - An IMPORTANT parameter.
140          - possible values
141               1 = none
142               2 = slight
143               3 = moderate
144               4 = severe
145          - an animal with abdominal distension is likely to be painful and
146            have reduced gut motility.
147          - a horse with severe abdominal distension is likely to require
148            surgery just tio relieve the pressure
149
150 14: nasogastric tube
151          - this refers to any gas coming out of the tube
152          - possible values:
153               1 = none
154               2 = slight
155               3 = significant
156          - a large gas cap in the stomach is likely to give the horse
157            discomfort
158
159 15: nasogastric reflux
160          - possible values
161               1 = none
162               2 = > 1 liter
163               3 = < 1 liter
164          - the greater amount of reflux, the more likelihood that there is
165            some serious obstruction to the fluid passage from the rest of
166            the intestine
167
168 16: nasogastric reflux PH
169          - linear
170          - scale is from 0 to 14 with 7 being neutral
171          - normal values are in the 3 to 4 range
172
173 17: rectal examination - feces
174          - possible values
175               1 = normal
176               2 = increased
177               3 = decreased
178               4 = absent
179          - absent feces probably indicates an obstruction
180
181 18: abdomen
182          - possible values
183               1 = normal
184               2 = other
185               3 = firm feces in the large intestine
186               4 = distended small intestine
187               5 = distended large intestine
188          - 3 is probably an obstruction caused by a mechanical impaction
189            and is normally treated medically
190          - 4 and 5 indicate a surgical lesion
191
192 19: packed cell volume
193          - linear
194          - the # of red cells by volume in the blood
195          - normal range is 30 to 50. The level rises as the circulation
196            becomes compromised or as the animal becomes dehydrated.
197
198 20: total protein
199          - linear
200          - normal values lie in the 6-7.5 (gms/dL) range
201          - the higher the value the greater the dehydration
202
203 21: abdominocentesis appearance
204          - a needle is put in the horse's abdomen and fluid is obtained from
205            the abdominal cavity
206          - possible values:
207               1 = clear
208               2 = cloudy
209               3 = serosanguinous
210          - normal fluid is clear while cloudy or serosanguinous indicates
211            a compromised gut
212
213 22: abdomcentesis total protein
214          - linear
215          - the higher the level of protein the more likely it is to have a
216            compromised gut. Values are in gms/dL
217
218 23: outcome
219          - what eventually happened to the horse?
220          - possible values:
221               1 = lived
222               2 = died
223               3 = was euthanized
224
225 24: surgical lesion?
226          - retrospectively, was the problem (lesion) surgical?
227          - all cases are either operated upon or autopsied so that
228            this value and the lesion type are always known
229          - possible values:
230               1 = Yes
231               2 = No
232
233 25, 26, 27: type of lesion
234          - first number is site of lesion
235               1 = gastric
236               2 = sm intestine
237               3 = lg colon
238               4 = lg colon and cecum
239               5 = cecum
240               6 = transverse colon
241               7 = retum/descending colon
242               8 = uterus
243               9 = bladder
244               11 = all intestinal sites
245               00 = none
246          - second number is type
247               1 = simple
248               2 = strangulation
249               3 = inflammation
250               4 = other
251          - third number is subtype
252               1 = mechanical
253               2 = paralytic
254               0 = n/a
255          - fourth number is specific code
256               1 = obturation
257               2 = intrinsic
258               3 = extrinsic
259               4 = adynamic
260               5 = volvulus/torsion
261               6 = intussuption
262               7 = thromboembolic
263               8 = hernia
264               9 = lipoma/slenic incarceration
265               10 = displacement
266               0 = n/a
267 28: cp_data
268          - is pathology data present for this case?
269               1 = Yes
270               2 = No
271          - this variable is of no significance since pathology data
272            is not included or collected for these cases
273
2748. Missing values: 30% of the values are missing
275</pre>
276</body>
277</html>
Note: See TracBrowser for help on using the repository browser.