NCES/NSF Summer Data Policy Institute – Day 5

這次的訓練課程終於接近尾聲了。出門將近一個禮拜,我累了。謝謝辛苦的老婆一個人在德州照顧我們家兩個小朋友,你一定也很累了!我很快就要回家了。

今天的行程很簡單,上午有我們的學員跟大家分享他們過去用NCES或是NSF的資料庫所作的研究。中午吃完午餐之後我們分小組做group project。明天上午每個小組要報告他們用這個禮拜所學到的資料庫所做的一個研究。由於我們只有一個下午的時間來準備我們的研究報告,因此這個報告不可能非常的嚴謹。不過我們小組非常的有效率。在大家分工合作之下:有人負責分析資料、有人做文獻探討、有人做PowerPoint…等等,最後我們只花了四個小時就完成了我們這組的小研究計畫。

明天的行程也很簡單。上午吃完早餐之後我們各個小組上台報告我們的研究成果,然後主辦單位做最後的閉幕報告。之後大家就各自回家。我的飛機是下午兩點,所以回到Denton應該是傍晚了。That’s it!

這個禮拜的訓練對我來說非常的有收穫!希望回去之後我可以好好的利用這次所學到的資料庫。我也希望這個暑假我計畫要完成的兩篇文章可以按照我的時間表完成!

NCES/NSF Summer Data Policy Institute – Day 4

第四天,我累了。該是準備回家的時候了。以下是今天的行程:

7:30 – 8:30 a.m. 早餐
8:30 – 9:15 a.m. Mid-week evaluation of Institute & Development of Small Groups
9:15 – 10:45 a.m. Survey of Doctorate Recipients Findings on International Collaboration
10:45 – 11:00 a.m. 休息
11:00 a.m. – 12:30 p.m. Delta Cost Project
12:30 – 1:30 p.m. 午餐
1:30 – 5:00 p.m. NELS, ELS, and HSLS綜覽與示範
6:30 p.m. Joint Dinner at hotel with T-T-T group

今天上午的兩堂課是兩個研究人員來介紹他們使用NCES和NSF的資料庫所做的研究。第一堂的講員講的是他如何使用SDR來研究學術界的國際合作關係。我個人覺得這個人的研究方法有一些問題,所以我對他的研究結果不是很有興趣。

第二堂的講員來自Delta Cost Project。他們使用IPEDS的資料經過運算和調整之後來分析大學的財務運作狀況。這個研究者的研究方法比第一個嚴謹許多,而且在教育政策的制定和運作上應該有很大的用處。I like it!

午餐之後我們花了一個下午學習NCES的另外三個長期性的追蹤調查:National Education Longitudinal Study of 1988 (NELS:88)、Education Longitudinal Study of 2002 (ELS:02)、和High School Longitudinal Study of 2009 (HSLS:09)。我對於這三個資料庫很有興趣,因為這三個長期性的追蹤調查從學生高中時期開始追蹤他們到高中畢業,上大學,然後到就業。如果沒有上大學的也會繼續追蹤他們高中畢業之後做了些什麼事情。這些資料對於研究者來說是非常有用的資訊,因為研究人員可以分析是什麼因素讓高中生決定升學或是不升學,還有什麼因素影響學生在大學裡的學業表現,以及他們畢業之後的就業情況。

NELS和ELS跟昨天學到的BPS和B&B不一樣的地方是NELS和ELS都有開放給公眾下載的資料檔案。這意思是說我可以把這些檔案下載作為教學的工具,讓我的學生有機會學習怎麼樣使用聯邦政府的教育資料庫。

另外一個不同的地方是NELS和ELS是屬於NCES下的中小學教育組所管轄的,前幾天學到的IPEDS, BPS, 和B&B則是高等教育組的產品。由於這些資料庫是由不同的單位所發展跟管理的,因此他們所用的線上管理工具也不同:IPEDS有IPEDS Data Center,BPS和B&B有PowerStats,而ELS和NELS則有eDAT。我不能理解同樣都是NCES的資料庫,他們為什麼不能整合一下他們的管理工具呢?這麼多種不同的資料管理工具讓我們這些使用者很困擾。

這幾天學了這些教育資料庫我還有一個感想就是美國人真的對於教育資料的收集非常的肯花錢和用心。你看他們有這麼多長期追蹤研究的資料庫還有全國將近7,000所大專院校的各種校園資料。這些資料對於政策制定和教育研究真的非常的有幫助。不知道台灣的教育部是不是也肯做這樣的投資。

晚餐時間我們跟另外一個也在這裡參加NCES訓練的團體一起吃晚餐。正好在這個團體受訓的其中一位是我在讀博士班時候的好朋友,所以我們便聊了一下近況,順便討論我們準備一起從事的研究。

NCES/NSF Summer Data Policy Institute – Day 3

今天是校外參觀的日子。美其名是到NCES參觀,其實NCES的辦公室既不新鮮也不華麗,就只是一般的辦公大樓而已。所以說是參觀,其實不過是換個地方上課而已。以下是我今天的行程:

9:30 – 9:45 a.m. 講員介紹
9:45 – 10:45 a.m. Data Confidentiality and Restricted Use License
10:45 – 11:30 a.m. NCES年度報告
11:30 a.m. – 12:30 p.m. Data Policy Seminar & Discussion
12:30 – 2:00 p.m. 午餐
2:00 p.m. – 3:30 p.m. Panel Discussion with Associations -American Council on Education (ACE), American Association of Community Colleges (AACC), National Association of Independent Colleges and Universities (NAICU)
3:30 p.m. 自由活動時間

今天上午的三堂課是由三位不同的NCES講師給我們上課。第一堂給我們講課的是NCES的統計主任,他講課的內容主要是NCES的保密規劃、相關法令、以及使用受限資料的申請程序。這堂課增長了我的一些見識,不過資料使用的申請程序我以前就已經知道了,所以幫助有限。

第二堂課的講師給我們介紹NCES每年出版最主要的年報:Digest of Education Statistics以及其他的年度報告。基本上這些資訊對我來說知道就夠了,對我研究沒有什麼太大的幫助。

第三堂課很有趣。IPEDS的主任跟我們介紹在Washington, D.C.最有影響力的六個高等教育專業組織(或是說白一點就是遊說團體),俗稱Big Six: American Council on Education (ACE), American Association of Community Colleges (AACC), National Association of Independent Colleges and Universities (NAICU), American Association of State Colleges and Universities (AASCU), Association of American Universities (AAU), National Association of Independent Colleges and Universities (NAICU), and Association of Public and Land-grant Universities (APLU)。這堂課我不但學到NCES的統計資料怎麼樣能夠影響教育政策的制定,同時我也學到政策的改變怎麼影響NCES資料的收集。很有趣!

午餐之後有三位來自Big Six的代表親自跟我們講解他們怎樣利用NCES的統計資料作為他們遊說的工具。這些事情是我們平常不住在DC的人很難接觸到的,因此對我來說很新鮮,很有趣。

下午三點半就下課了。下課之後是我們這個禮拜唯一的自由活動時間。我想既然閒閒沒事,不如去幾個我以前來DC的時候沒有去過的地方走走。

我首先來到的地方是美國的國會圖書館(Library of Congress)。

美國國會圖書館總共有三棟非常龐大的建築(我應該這麼說:DC的每一棟建築物在我看來都非常的龐大)。我只去參觀了其中最主要也是最有名的一棟:Thomas Jefferson Building。我想如果你有看過「國家寶藏2:古籍秘辛」這部電影,你應該會對國會圖書館的內部覺得有點熟悉。其實國會圖書館不只是全世界藏書最多的圖書館,它的建築物本身也非常的華麗。我照了一些照片,你們可以看看。

在國會圖書館我還從導覽員那裡聽來兩個趣聞。第一是國家寶藏2的製片在拍完電影之後決定把電影裡面所捏造的那本President’s Book of Secret送給國會圖書館。因此,這本現實生活中並不真的存在的President’s Book of Secret就由國會圖書館收藏著。第二、由於國會圖書館的藏書量實在太龐大,如果你要閱讀某一本書,你必須寫紙條請館員去幫你取書。館員找到你的書之後會把它放在一條輸送帶上,然後這個輸送帶走走走走走。從你把紙條交給館員到你拿到書最少要一個小時的時間。找一本書要一個小時,夠扯了吧!

從國會圖書館出來之後,我坐Metro從Capitol South到Smithsonian下車。然後在D.C.華氏九十度的豔陽之下走了一個多小時來到Lincoln Memorial 。很久沒有走這麼遠的路,走到我的腳好痠。在Lincoln Memorial待了一下,照了一些照片。回旅館的路上在George Washington University的學生活動中心隨便吃了個晚餐,回到旅館已經快要九點了。就這樣結束算是充實的一天。

我的偶像Rev. Martin Luther King, Jr.和Mr. Forrest Gump都曾經站在這裡演講,請參照這裡這裡

NCES/NSF Summer Data Policy Institute – Day 2

今天是上課的第二天。以下是我今天的行程:

7:30 – 8:30 a.m. 早餐
8:30 – 9:00 a.m. NCES研究方法綜覽
9:00 – 9:20 a.m. NPSAS綜覽
9:20 – 10:00 a.m. Using PowerStats with NPSAS data
10:00 – 10:15 a.m. 休息
10:15 a.m. – 11:00 a.m. NPSAS 操作
11:00 a.m. – 11:30 a.m. BPS綜覽
11:30 a.m. – 12:10 p.m. Using PowerStats with BPS data
12:10 – 1:10 p.m. 午餐
1:10 – 1:50 p.m. BPS 操作
1:50 – 2:20 p.m. B&B 綜覽
2:20 – 2:35 p.m. 休息
2:35 – 3:15 p.m. Using PowerStats with B&B data
3:15 – 3:45 p.m. B&B 操作
3:45 – 4:45 p.m. Beyond PowerStats: Using micro-level sample
4:45 – 5:00 p.m. 問答時間

今天吃完晚餐我就已經累到沒力了,所我回到旅館七點多就睡著了。沒想到睡到半夜就醒了。既然醒了就把今天發生的事情記錄一下吧!

今天的講師裡面有一位是我認識的。當年我還在NSSE上班的時候,有一年我們要請一個研究員。其中一個來應徵的是一個非常優秀的博士班學生。我們大家都很喜歡他,因此決定要請他。不過他並沒有接受我們給他的offer。後來我們兩個在研討會裡面又見過幾次。他告訴我說幾個月前他拿到了這份美國政府的工作。我很高興可以認識NCES內部的人,這對我以後做研究應該會有幫助。

今天整天的課程都在介紹NCES的高等教育組所管轄的三個學生資料庫:National Postsecondary Student Aid Study (NPSAS)、Beginning Postsecondary Students Longitudinal Study (BPS)、Baccalaureate and Beyond (B&B)。跟昨天所學到的資料庫不同的是今天的資料庫中有兩個是長期性的追蹤調查(昨天的NSF資料庫也有一個是長期性追蹤的調查):BPS追蹤一個大學生從入學到大學畢業,B&B追蹤一個大學生從畢業開始的第一個十年。長期性的追蹤調查跟一次性的調查不一樣的地方是研究人員可以更加準確的分析各種教育政策、學校環境、以及教學方法對於學生的影響。當然,要長期性的追蹤一個人不是一件容易的事情,既耗時間又花錢。因為這個原因,大部分的研究人員都沒有財力跟能力收集長期性的調查資料。還好,美國政府幫了我們一個忙,他們出錢出力收集了資料,讓我們這些做研究的人可以使用現成的資料。(美國政府收集這些資料的主要目的是為了政策制定上的需要,我們這些研究人員只是搭便車而已。)

除了學到這三個資料庫之外,今天最大的收穫是學到NCES的線上統計分析工具PowerStats。我一向對於這些線上的統計分析軟體沒有什麼太大的好感。我比較喜歡把資料下載到我的電腦裡面用SPSS或是R來做分析。但是NCES和NSF的這些資料庫裡的資料是不公開的。如果要把資料下載到我的電腦裡,我必須要先通過一連串的申請跟審核程序,然後我必須根據NCES的要求設定一系列的安全保護措施以防止資料外漏,最後我必須要簽NCES的保密協定才能拿到資料。這整個申請程序花時間不說(大概三到六個月跑不掉),如果資料外漏或是沒有按照NCES的規定使用資料,簽約的研究員將被罰款美金$250,000還要被關五年。我想很多人看到最後一句大概就已經打消使用NCES資料的念頭了。還有,NCES只跟美國的大學和特定的研究機構分享資料,除非你在美國的大學任教或是在某些特定的研究機構做研究,一般人是不可能拿得到NCES資料的。

PowerStats比我想像中的容易使用也更強大。PowerStats不只可以產生常用的敘述性統計,它還可以做線性迴歸分析和Logistic Regression。更棒的是PowerStats在背後幫使用者處理了複雜的weighting和其他NCES資料庫使用者所必須面對的問題。不過我也很高興可以學到怎麼修正NCES複雜的抽樣程序所可能造成的問題。這些我以前沒有聽過的統計程序像是Balanced Repeated Replication (BRR)和Taylor Series Expansion讓我非常的興奮。不過這些程序在SPSS裡面似乎很難做到,看來我真的得好好的學R了。

以下是今天練習用PowerStats所做的分析:

美國公立大學的大學生平均每個禮拜在上課之餘還要打工18.27個小時。以下是十個學生工作時數最多的州以及學生的平均工作時數:

  • Nevada 25.9138
  • Utah 25.7379
  • Florida 23.4099
  • Idaho 23.1322
  • Alaska 22.6868
  • New Jersey 20.8397
  • Alabama 20.7523
  • Maryland 20.5945
  • Arkansas 20.3382
  • Louisiana 19.7401

By the way,PowerStats和我昨天提到的IPEDS都是開放給公眾使用的。如果你對統計有基本的瞭解又美國的教育資料有興趣,你可以去玩玩看PowerStats和IPEDS。如果你對統計不是那麼懂,可以試試QuickStats。如果你對統計完全沒有興趣,但是你想要更深入的瞭解美國的某一所大學,那你可以看看NCES為了那些在申請美國大學的學生所準備的網站College Navigator:

PowerStats/QuickStats: http://nces.ed.gov/datalab/index.aspx
IPEDS Data Center: http://nces.ed.gov/ipeds/datacenter/
College Navigator: http://nces.ed.gov/collegenavigator/

NCES/NSF Summer Data Policy Institute – Day 1

經過昨天半天的orientation,今天正式開始上課。(今天這一篇blog會有很多的專業術語,我會盡量的解釋,如果你們看不懂也不用太在意。各行各業都有自己的行話,這些術語是我們高等教育界的行話。)

以下是我今天的行程表:

7:00 am 起床
7:00-8:00 am 早餐
8:00-9:00 am 大會報告
9:00-10:30 am NSF和NCES資料庫綜覽
10:30-10:45 am 休息
10:45 am -12:00 pm NSF資料庫
12:00-1:00 pm 午餐
1:00-2:50 pm IPEDS第一堂
2:50-3:10 pm 下課
3:10-5:00 pm IPEDS第二堂及上機操作

NSF是National Science Foundation,NCES是National Center for Education Statistics,IPEDS是Integrated Postsecondary Education Data System。很多人(包括我老婆在內)問我到DC來參加這個訓練的目的是什麼?IPEDS(發音I-peds)是什麼鬼東西?Well,IPEDS的確是個鬼東西,不過不是學高等教育的人不需要去深入探討。來參加這個訓練最主要的目的是希望可以更熟悉美國聯邦政府所管轄的這些教育資料庫,好讓我在做研究的時候不缺資料。

今天早上的兩堂課都是綜覽,所以都是老師在上面講,我們在下面聽。第一堂課我精神蠻好的,還問了老師好幾個問題。第二堂課前半段跟第一堂有一點重複,所以我聽了很想睡覺。後來雖然學了一些新的東西,但是我整堂課精神都不是很好。

今天上午的課最大的收穫就是認識了很多我以前從來不知道的NSF資料庫:Survey of Earned Doctorates (SED)、Survey of Doctorate Recipients (SDR) (Science & Engineering only)、Survey of Graduate Students and Postdoctorates in Science and Engineering (institutional survey)、National Survey of College Graduates (NSCG)、National Survey of Recent College Graduates (RCG)、Business Research and Development and Innovation Survey  (BRDIS)。我想對我以後研究最有幫助的應該是SED, SDR, NSCG,和RCG。不過NSF的資料庫名稱跟內容有的時候沒有直接的關係,這一點非常容易讓人混淆。

中午的午餐和休息總共只有50分鐘(因為下課太晚),所以我快快的吃完午餐之後回房間小睡了20分鐘。

下午兩堂課都在講IPEDS。我對IPEDS其實不陌生。從我以前還在NSSE上班的時候就多多少少的有接觸IPEDS。但是今天上了課之後才知道我對IPEDS的瞭解真是只有皮毛。看到IPEDS的龐大跟複雜,讓我更加佩服各校裡面負責收集和管理IPEDS資料的IR人員。我想今天下午最大的收穫就是我對於IPEDS Data Center更加的熟悉。雖然我以前也用過IPEDS Data Center,但是今天上課學到很多以前不知道的功能。回到旅館之後我又繼續 花了好幾個小時在IPEDS Data Center抓資料下來分析。其中一個分析的結果發現在2008年秋季班,德州四年制的公立以及非營利性的私立大學的新生中除了德州本州居民之外,第二多的是國際學生,總共有1,633位新生,再其次是加州726位。以下是前面十名:

  1. Texas 81,598
  2. International Students 1,633
  3. California 726
  4. Louisiana 362
  5. Colorado 329
  6. Illinois 289
  7. Oklahoma 283
  8. New Mexico 268
  9. Florida 213
  10. Missouri 187

如果你看到這裡還沒有無聊到放棄,算你厲害,請給自己拍拍手!就這樣,今天報告完畢!