従業員を動機づけるためには,業績評価システムを適切に設計・運用することが必要だ。特に評価に用いる業績指標を適切に選択できなければ,従業員を企業の求めるものとは異なった方向に動機付けてしまうかもしれない。例えば,短期的な業績が反映される業績指標を用いると,従業員は長期的な業績を犠牲にしてでも短期の業績を追い求めるかもしれない(Merchant 1990; Merchant and Van der Stede 2023)。また,適切な難易度の目標を設定しなければ,十分な努力量を引き出すことはできない (Locke and Latham 2002)。難易度の高すぎる目標は諦めを,低すぎる目標は怠惰をもたらす。
多くの従業員は複数の業務を受け持つが,それらの業務間の努力配分は,業績指標の選択と強く結びついている(Feltham and Xie 1994)。片方の指標がもう片方の指標よりも精度が良かった場合,それぞれの指標の評価上のウェイトが同じでも,より精度が高い方に注意を向けるようになる。また,もし指標間の精度が同じで,なおかつ評価上のウェイトが同じであっても,指標間の難易度に差がある場合,より達成可能性が高い方に努力を集中することが予測される。そういった意味で,業績評価のデザイン,特に指標の選択は,業績評価システムを構築する上で重要である。
業績評価に用いられる業績指標(特に非財務的業績指標)は,ポジティブにもネガティブにも表示することができる。例えば生産における成功率と失敗率,小売における顧客満足度と不満足度の指標は,成功率(満足度)= 1 - 失敗率(不満足率)であるため,同じ情報を持っている。にもかかわらず先行研究では,同じ情報をポジティブに表示する場合とネガティブに表示する場合で,測定される対象の評価が異なることが明らかになっている(Levin and Gaeth 1988)。一方で,この評価の違いが,自身の業務目標の設定や努力水準にどのような影響があるかについては明らかになっていない。もし業績の表示方法がポジティブかネガティブかによってその測定対象の評価が異なるのであれば,その業務に対する難易度を異なった形で見積もるかもしれない。特に,ネガティブな表示方法はポジティブなものに比べ悪い結果を連想させ,達成可能性を低く見積もる可能性がある。結果として,目標設定において,ネガティブな表示方法はより保守的な目標をもたらす可能性がある。また,その測定に基づくインセンティブ契約の効用も表示方法によって変わり,結果としてその測定指標に関連する努力量も異なってくることが予測される。特に,人はよりネガティブな指標に注目する傾向があると言われており(Tversky and Kahneman 1986),ネガティブな指標により注意を払う。結果として,ネガティブな表示方法をした方が努力が引き出されると考える。これらの予測を元に,本研究では業績指標の表示方法の選択が,従業員の目標設定や努力に影響を与えるか否かを検証する。
本研究は,業績指標の並べ方や見せ方が従業員の業績の判断に影響を与えるという先行研究と関連している(Cardinaels and Veen-Dirks 2010; Lipe and Salterio 2002)。これらの研究では,複数の業績指標の並べ方や,補助的な情報の有無が,従業員の業績評価指標を元にした判断に影響を与えるということを示している。これらの研究は,上司の立場から部門の評価を行う,といった場面を想定している。対して本研究は,会計指標の表示の仕方,特にポジティブかネガティブかというフレーミングを対象としている点に違いがある。加えて,本研究は上司の立場からの他者評価ではなく,自身が業務を行う際の目標設定や期中の努力といった側面に対して,表示方法の違いが影響を与えるか否かを検証するという面で違いがある。
本研究は,業績評価システムの設計において新たな視点を提示する。第1に,業績評価指標のフレーミングが従業員の努力に影響を与えるという点である。業績指標は大抵の場合,予算と結びついている。一般に予算は二つの目的を持つとされる(Arnold and Artz 2019)。予算には計画・資源配分に利用されるという側面があり,その目的においては,現実的な予測値が望ましい。一方で,予算は業績評価システムにおける目標値としても用いられる。この目的においては,予算は現実よりも高いものが企業としては望ましい。予算が両者の目的を持つとき,インセンティブ目的で現実から離れた目標を設定することは難しい。つまり,インセンティブ目的で目標を設定する際,その設定自由度は必ずしも高くない。
業績評価に関連する研究において,指標の選択は古くから研究のなされる領域である。主にエージェンシー理論を基礎として,望ましい指標の特性や,組み合わせが議論されてきた (Hölmstrom 1979; Milgrom and Roberts 1992)。エージェンシー理論をベースにした研究では,従業員が企業にとって望ましい方向の努力を引き出すための指標の選択についての指針が示される。例えば,Banker and Datar (1989) では,望ましい業績指標の特性として,業績指標が従業員の行動を測定する上での感度と精度を取り上げた。
業績評価研究において,情報の見せ方によってその対象への評価が変わることが示されてきた。Lipe and Salterio (2002) や Cardinaels and Veen-Dirks (2010) は,複数の業績指標を用いて評価する際,情報の並び方や追加情報(目標を達成したかどうかを+ や - を使って示す)が判断に影響することを示してきた。情報の並びや目標達成状況を示す目標は,追加的な情報を示しているわけではない。にも関わらず,評価者情報の受け取り方が変わるという点は,情報の表示方法に注目した本研究と関連している。
2.2 属性フレーミング
属性フレーミングは,情報の提示が人々の評価や意思決定にどのような影響を与えるかを指す(Levin, Schneider, and Gaeth 1998)。同じ属性や結果が異なる方法で説明されるとき、それはさまざまな認識や選択につながる可能性がある。例えば,あるプロジェクトに関して「成功する確率は90%である」と記述することと,「失敗する確率は10%である」と表現することは,論理的には同一であるが,どちらの表現かによって人は異なる情報処理を行い,対象に対する異なる評価を下すことが知られている。特に,ポジティブな表現を聞いた場合はネガティブな表現を聞いた時よりも対象へ好ましい評価をすることが傾向があるとされる。有名な例は,“75%の赤身”と説明された牛肉は,“25%の脂肪”と説明された牛肉より高い評価を受けた,という Levin and Gaeth (1988) の研究である。
業績指標がインセンティブ報酬と結びついているとき,属性フレーミングがどのような影響をもたらすかについては,ほとんど明らかになっていない。インセンティブとフレーミングの関係において罰の回避の方が努力を引き出すことが知られている (Hannan et al. 2005; Frederickson and Waller 2005) 。もし,目標フレーミングと同様に,属性フレーミングにおいてもネガティブなフレーミングが損失回避の動機づけと結びつく場合,インセンティブ報酬がその動機づけを強める可能性がある。一方で,属性フレーミングは目標フレーミングと異なり,実際に罰金のようなネガティブな報酬が生じるわけではない。そのため,属性フレーミングの違いは目標フレーミングのようにインセンティブによって動機づけ効果が強められるわけではない可能性がある。
In this study, we used a decoding task in which participants translated randomly sequenced numbers into the corresponding alphabet. Specifically, we presented participants with cards like the one shown in Figure 1 , and they translated the five-digit numbers into the alphabet using the upper side of the card. This task has been used in a number of studies, including accounting studies (Chow 1983).
Participants redirected to our website from Prolific first read instructions pages about the experiment itself and the task they perform. They then conduct the two-minute practice round. After the practice round, the participants read the rule about performance evaluation and rewards, followed by a quiz page to ensure their understanding of the instructions. Incorrect answers are redirected to a retry page of the same question. After successfully completing the quiz, participants proceed to the experimental task. The main task consisted of four rounds. In each round, participants set a target number of cards to try in 120 seconds. They could try cards up to the number they set as the target. After the four rounds of the main task, participants answered a post-experiment questionnaire.
We designed the experiment using oTree (Chen, Schonger, and Wickens 2016), a Python-based environment specialized for designing web-based experiments or surveys.
3.2 Experimental design
The base reward is calculated by the formula below
\(Tried\) refers to the cards they actually tried,\(Success\) represents the number of cards they succeeded in solving, and \(Target\) represents the targeted number of cards participants set each round. Participants are instructed to aim for a 90% success rate or higher (10% failure rate or lesser) and work on as many cards as possible, regardless of conditions.
In this task, we are conducting a 2 x 2 between-participants experimental design where we manipulate two factors. The first factor is the framing of the performance measure (framing). All participants will be evaluated based on the number of cards they attempt to decode. However, participants in the positive framing condition (Positive) will be evaluated based on their success rate (i.e. the number of cards that they successfully decode out of the total number of cards set as the target). On the other hand, participants in the negative framing condition (Negative) will be evaluated based on their failure rate (i.e. the number of cards they fail to decode out of the total number of cards set as the target).
The second factor that was manipulated in this study is the incentive scheme (incentive) which consists of liner condition (Liner) and incentive condition (Incentive). In the liner condition, participants are evaluated based on the number of cards tried multiplied by the success rate, which is calculated by the points. There is no fixed target regarding framed performance measures in the liner condition. However, in the incentive condition, participants with a success rate of 90% or higher (a failure rate of 10% or less) receive 150% of the points. It is worth noting that one point equals £0.07.
3.3 Participants
For our experiment, we recruited 220 individuals from Prolific, an online crowdsourcing service for experimental research. To ensure consistency, we limited the sample to those in the US or the UK. We did not set a fixed fee for participation, but Prolific sets the minimum fee based on the actual time taken by participants to complete the experiment. If the fee offered by the system falls below the minimum, we provide the minimum fee (which is approximately £2.7) instead of the fee based on the points.
60% of participants are residents of the US, the mean (SD) age was 36.9 (12.8), 50% are female, 18% have student status, and 43% are full-time workers.
4 Results
4.1 Variables definition
For examining H1, we use Target, the targeted number of cards the participants set as their own target. For examining H2 and H3, We decompose the SRate of (1) as such to separate the target setting practice and the effort for the incentivized task: how accurate when they complete the cards
Accurate is the number of successes out of the actual attempts, so it represents the accuracy of the work. We also examine the TrialRate, which represents the difficulty of the target.
As manipulation variables, we use framing and incentive, each of which represents framing of performance measures (Positive or Negative) and incentive conditions (Liner and Incentive).
Table 1 は条件ごとの記述統計である。frame 条件ごとに見ると,Target はネガティブな方が少ない ( t = 2.685, p = 0.008) 。ネガティブなフレーミングは保守的な目標設定をもたらす。TrialRate はネガティブな方が大きい ( t = -2.309, p = 0.022)。難易度の低い目標になっていると言える。Accurate, SRate, Baseに有意な差がない。
incentive条件ごとに見ると,Target はインセンティブありの方が多い( t = 0.834, p = 0.405)。インセンティブ条件は,インセンティブがかかる指標(成功率)だけではなく,目標にも影響を与える。Accurate はインセンティブありの方が多い( t = -2.424, p = 0.017)。インセンティブに従い,成功率が上がる(失敗率が下がる)。
dfc_full <- dfc_full |>mutate(s_rate_p =ifelse(num_trials_p !=0, num_correct_p / num_trials_p,0))# Create a list of t-testst_tests_list <-list(target_trial =t.test(num_trials_p ~ frame, data = dfc_full),s_rate2 =t.test(s_rate_p ~ frame, data = dfc_full))# Extract t-values and p-values using map()new <-data.frame('t.value'=map_dbl(t_tests_list, "statistic"),'p.value'=map_dbl(t_tests_list, "p.value"))# Create a list of t-testst_tests_list <-list(target_trial =t.test(num_trials_p ~ incentive, data = dfc_full),s_rate2 =t.test(s_rate_p ~ incentive, data = dfc_full))# Extract t-values and p-values using map()newi <-data.frame('t.value'=map_dbl(t_tests_list, "statistic"),'p.value'=map_dbl(t_tests_list, "p.value"))
業績指標は大抵の場合,予算と結びついている。一般に予算は二つの目的を持つとされる(Arnold and Artz 2019)。予算には計画・資源配分に利用されるという側面があり,その目的においては,現実的な予測値が望ましい。一方で,予算は業績評価システムにおける目標値としても用いられる。この目的においては,予算は現実よりも高いものが企業としては望ましい。予算が両者の目的を持つとき,インセンティブ目的で現実から離れた目標を設定することは難しい。つまり,インセンティブ目的で目標を設定する際,その設定自由度は必ずしも高くない。
本研究は,実験室実験という方法をとったため,他の多くの研究と同様に外的妥当性に関する限界を持つ。また,本研究においては,業績指標が全て非財務指標であった。実際の企業においては,非財務指標は財務指標とともに用いられると考えられるが,アウトカム指標である財務指標とプロセス指標である非財務指標を同時に用いた場合に両者の扱いに違いがあることが指摘されている(Ittner, Larcker, and Meyer 2003; Tan and Lipe 1997)。このようにそもそも主観的重みづけが異なる時,本研究で発見した非財務指標をネガティブにフレーミングすることで努力を振り向ける,という効果は打ち消される可能性がある。逆に,非財務指標をネガティブにフレーミングすることで,財務指標への過度な注目を和らげることができる可能性もある。財務指標と非財務指標を同時に用いた際のフレーミングの効果についての検討は将来の課題としたい。
Chen, D. L., M. Schonger, and C. Wickens. 2016. oTreeAn open-source platform for laboratory, online, and field experiments. Journal of Behavioral and Experimental Finance: 10.
Merchant, K. A., and W. A. Van der Stede. 2023. Management control systems: Performance measurement, evaluation and incentives. 5th ed. New York: Pearson.